基于Itti视觉显著性模型的感兴趣区域自动选择系统
项目介绍
本项目完整实现了经典的Itti-Koch视觉显著性计算模型,旨在从自然图像中自动提取人眼注视的显著区域。系统模拟人类视觉系统的多尺度、多特征处理机制,通过构建图像的高斯金字塔,分别提取颜色、亮度和方向特征,并计算中央-周边差异图,最终融合生成全图的显著性图谱。系统进一步采用动态阈值分割技术,自动聚焦并勾勒出最显著的感兴趣区域(ROI)。本项目提供从特征计算到结果可视化的完整流程,支持单张图像处理和批量分析,适用于图像分析、计算机视觉预处理、人机交互研究等多个领域。
功能特性
- 多尺度特征提取:采用高斯差分金字塔,模拟视网膜和初级视觉皮层的多尺度处理特性。
- 多层次特征融合:整合颜色、亮度和方向三个视觉通道的特征,生成综合显著性图。
- 自适应ROI提取:基于显著图的动态阈值分析和形态学后处理,自动分割并优化显著区域边界。
- 灵活的输入输出:支持单张或多张标准格式(JPG/PNG/BMP)图像批处理。
- 丰富的输出结果:
- 原始图像与显著性热图的叠加可视化显示
- 标记显著区域轮廓的二值化ROI掩模
- 包含ROI坐标、显著性峰值强度、区域面积等数据的统计文件
- 参数可配置:允许用户调整图像尺寸标准化阈值、金字塔层数、各特征权重系数等关键参数。
使用方法
- 准备输入图像:将待处理的图像(JPG/PNG/BMP格式)放置于指定输入目录。
- 配置运行参数(可选):根据需要,在代码中修改图像预处理尺寸、金字塔层数、各特征权重等参数。
- 执行主程序:运行主程序文件,系统将自动完成显著性计算与ROI提取全过程。
- 获取输出结果:程序执行完毕后,在输出目录中查看以下结果:
-
result_visualization.png:显著性热图与原始图像的叠加效果图
-
roi_mask.png:二值化的显著区域掩模图
-
roi_data.txt:包含各ROI详细信息的统计表格
系统要求
- 操作系统: Windows / Linux / macOS
- 软件环境: MATLAB R2016b 或更高版本
- 内存建议: 不低于4GB RAM(处理高分辨率图像时建议8GB以上)
文件说明
主程序文件整合了系统的全部核心处理流程,负责调度并执行图像数据读取与预处理、多尺度高斯金字塔的构建、颜色、亮度及方向特征图的生成与归一化、跨尺度的中央周边差异计算、各特征通道的线性融合以生成显著性图谱、基于自适应阈值的显著区域二值化分割、ROI边界的优化与轮廓提取,以及最终结果的可视化渲染与数据文件的输出。