基于YCbCr色彩空间的静态图像嘴唇区域检测与定位系统
项目介绍
本项目实现了一种针对静态人脸图像的自动嘴唇检测与分割系统。该系统基于颜色空间变换原理,利用唇部组织在色彩分量上与周围皮肤的显著差异,在YCbCr色彩空间下构建特征映射模型。通过结合自适应阈值分割、形态学优化以及几何特征筛选技术,系统能够从背景中精准提取嘴唇位置。该技术可广泛应用于人脸特征点提取、美颜滤镜预处理、唇语识别辅助等计算机视觉领域。
功能特性
- 自适应图像预处理:自动读取多种格式图像(JPG, PNG, BMP等),并针对高分辨率大图进行等比例缩放,平衡处理速度与精确度。
- 特征映射增强:利用YCbCr色彩空间特性,通过数学建模放大红、蓝分量的差异,生成高对比度的嘴唇特征图(Lip Map)。
- 全自动分割:采用大津法(Otsu's method)计算自适应阈值,无需人工干预即可将目标区域与面部皮肤分离。
- 鲁棒的形态学处理:集成闭运算、孔洞填充、小面积去除及开运算等步骤,有效抑制光照和皮肤杂质带来的噪声。
- 智能定位决策:系统不仅提取连通域,还根据嘴唇的扁平比、图像纵向位置及面积占比进行综合评分,精确定位唯一的嘴唇候选区域。
- 多维度结果展示:可视化输出涵盖原始图、灰度映射图、二值掩膜图及最终标注图,并同步输出详细的像素坐标信息。
使用方法
- 启动MATLAB环境。
- 运行程序,系统将弹出标准文件选择对话框。
- 在对话框中选择一张包含清晰人脸的静态图像文件。
- 程序将自动执行检测算法,处理完成后会弹出四个对比子图。
- 在控制台查看嘴唇的左上角坐标、宽度、高度及中心点位置。
系统要求
- 软件环境:MATLAB R2016b 及以上版本。
- 工具箱配套:需安装 Image Processing Toolbox(图像处理工具箱)。
- 硬件要求:支持标准图形显示的计算机,内存建议4GB及以上。
实现逻辑与算法分析
1. 色彩空间转换与分量分析
系统将输入的RGB图像转换为双精度YCbCr模型。在此空间中,Y代表亮度,Cb代表蓝色色度,Cr代表红色色度。由于唇部粘膜组织富含毛细血管,其Cr分量显著高于皮肤区域,而Cb分量相对较低,这一物理特性构成了检测的统计学基础。
2. 嘴唇特征映射模型(Lip Map)
系统采用了一种经典的非线性变换公式:
LipMap = Cr^2 * (Cr^2 - η * (Cr/Cb))^2
其中,控制系数η基于全图Cr与Cb的统计比例自适应计算(0.95倍的Cr平方和与Cr/Cb之比)。该公式通过四次幂运算极大增强了嘴唇区域的能量响应,同时通过Cb的倒数关系抑制了偏蓝或偏绿的背景干扰。
3. 图像分割与形态学优化
- 自适应二值化:通过
graythresh 计算最优阈值,将连续的特征映射图转化为二值掩码。 - 闭运算与填充:使用半径为3的圆盘形结构元素进行闭运算,通过
imfill 填充唇部因反光或牙齿遮挡产生的内部孔洞。 - 区域噪声过滤:利用
bwareaopen 剔除由于红斑或背景干扰产生的微小误检测区域,阈值设定为图像总像素的0.1%。
4. 连通域特征提取与智能筛选
利用
regionprops 提取所有候选区域的属性,并应用以下约束条件进行最优目标筛选:
- 长宽比过滤:嘴唇呈扁平状,系统限定其外接矩形长宽比需在1.2至6.0之间。
- 位置评分:考虑到人脸解剖学结构,通过计算质心的纵向坐标(y_pos_score),给予位置偏下的区域更高权重。
- 面积评估:结合区域面积占比进行综合评分,最终选取分值最高的连通域作为检测结果。
5. 坐标定位与可视化输出
定位成功后,系统在原图上绘制红色矩形框和绿色中心十字标,并利用
imcrop 实现目标区域的逻辑截取。控制台实时打印嘴唇的几何参数(Height, Width, Centroid),为后续分析提供结构化数据支持。