基于线性预测分析的语音信号基音周期提取系统
项目介绍
本项目采用线性预测编码(LPC)技术,实现了一套完整的语音信号基音周期提取系统。系统通过线性预测分析获取语音共振峰信息,并利用残差信号的自相关特性进行基音周期检测,可广泛应用于语音分析、发声研究及语音合成等领域。
功能特性
- 完整预处理流程:提供分帧、加窗、预加重等标准语音预处理功能
- 先进的LPC分析:采用线性预测分析技术精确提取语音共振峰特征
- 多策略基音检测:结合自相关函数峰值检测与语音活动检测(VAD),提高检测准确性
- 灵活的参数配置:支持自定义采样频率、帧长、帧移、预加重系数等关键参数
- 性别自适应:根据语音性别特征自动调整基音搜索范围,提升检测精度
- 丰富的可视化输出:提供原始语音、残差信号、基音轨迹及基频统计等多维度图形展示
- 数据导出功能:支持基音周期数据导出为txt或csv格式
使用方法
- 准备语音文件:确保输入为.wav格式的语音信号文件
- 参数设置:
- 默认采样频率:16kHz(可自定义)
- 帧长设置:建议20-30ms范围
- 性别选择:根据语音特征选择男性/女性模式
- 运行分析:系统将自动完成预处理、LPC分析和基音检测全流程
- 结果查看:
- 图形界面显示分析结果
- 控制台输出每帧基音周期(采样点)和基频值(Hz)
- 数据导出:可选择将基音周期数据导出为文本文件
系统要求
- 操作系统:Windows/Linux/macOS
- 软件环境:MATLAB R2018b或更高版本
- 内存需求:建议4GB以上RAM
- 存储空间:至少500MB可用空间
文件说明
主程序文件整合了系统核心处理流程,主要包括语音信号预处理、线性预测分析参数计算、残差信号生成与自相关分析、基于能量阈值的语音活动检测、基音周期峰值识别算法,以及多种分析结果的可视化展示与数据导出功能的集成实现。