基于短时能量与过零率的语音信号清浊音自动提取系统
项目介绍
本项目是一个基于短时能量与短时过零率分析的语音信号处理系统,实现了语音清浊音的自动判别与提取。系统采用经典的双门限阈值判别算法,能够准确识别语音信号中的清音段和浊音段,并提供丰富的可视化结果和统计信息输出。
功能特性
- 信号预处理:支持预加重、分帧加窗处理(汉明窗/矩形窗可选)
- 特征提取:计算短时能量和短时过零率特征参数
- 清浊音判别:采用双门限阈值法自动判别清浊音段
- 可视化展示:显示原始波形、特征曲线和判别结果
- 音段定位:输出清浊音段的起止时间和统计信息
- 音频分离:生成分离的清音和浊音音频文件
使用方法
- 准备音频文件:确保输入为.wav格式,采样率8kHz-44.1kHz,单声道
- 设置参数:可调整帧长(默认256点)、帧移(默认128点)、能量阈值、过零率阈值
- 运行系统:执行主程序,系统将自动处理并显示结果
- 查看结果:系统将显示四幅分析图表,并输出时间矩阵和统计表格
- 获取音频:分离的清音和浊音段将保存为独立音频文件
系统要求
- MATLAB R2018b或更高版本
- 信号处理工具箱
- 音频处理工具箱
文件说明
该文件是本系统的核心主程序,负责整合所有功能模块,包括:语音信号的读取与预处理流程控制,短时能量与过零率特征参数的提取计算,基于双门限阈值法的清浊音自动判别算法的执行,以及分析结果的可视化展示和输出文件的生成。作为系统入口,它实现了从音频输入到清浊音判别完整流程的自动化处理。