该项目旨在实现对包含多行文字的图像进行智能化的行级别分割与提取。系统通过对原始图像进行灰度化、去噪以及自适应二值化预处理,将文字内容从复杂的背景中有效分离。其核心原理是基于水平投影法,即在水平方向上统计每一行像素的分布情况,通过寻找投影直方图中的波谷来确定行与行之间的间隙,通过波峰来定位文字行的具体范围。项目支持对不同字体大小、不同行间距的文本进行鲁棒性处理,并能够自动剔除图像边缘的微小噪点干扰。在识别出每行的起始与结束坐标后,系统会自动调用裁剪函数,将长篇幅的文字图像分解为多个独立的、高度规整的单行文字