本站所有资源均为高质量资源,各种姿势下载。
在语音信号处理中,基频(Fundamental Frequency)是描述声带振动频率的重要特征,常用于语音分析、合成及识别。基于自相关函数的基频提取方法通过检测信号周期性来实现,以下是实现思路的分步说明:
信号分帧处理 将语音信号按100ms的窗口长度分段,相邻窗口重叠75ms(即25ms的窗移),确保时间连续性。分帧可防止突变,同时保留信号的短时平稳特性。
自相关计算 对每一帧信号计算自相关函数,通过比较信号与其延迟版本的相似性来检测周期性。设置最大延迟时间(max_time_lag)为100ms,对应最低可检测基频为10Hz(1/0.1s)。
峰值检测与基频估计 在自相关函数中,除零延迟外的首个显著峰值对应的延迟时间即为基音周期。取该周期的倒数即为当前帧的基频(单位Hz)。需注意滤除倍频或半频错误。
构建基频向量与绘图 将各帧基频按时间顺序排列为向量,缺失段(如清音或静音)可设为0或NaN。最终绘制音高轮廓(Pitch Contour),横轴为时间,纵轴为基频值,直观反映语音的语调变化。
扩展思考 自相关法在低信噪比环境下可能失效,可结合短时能量或过零率辅助判断清/浊音。 更鲁棒的基频提取算法(如倒谱法、YIN算法)可进一步减少倍频错误。