双语数字及基础指令语音识别系统
项目介绍
本项目是一个基于动态时间规整(DTW)算法的双语语音识别系统,专门针对英语和波斯语环境下的数字(0-9)及基础指令进行识别。系统采用MATLAB实现,结合语音信号预处理技术,提供高准确率的语音识别功能。系统支持两种运行模式(命令行和GUI)和两种音频输入方式(实时录音和文件识别),满足不同场景下的使用需求。
功能特性
- 双语支持:同时支持英语和波斯语两种语言的语音识别
- 数字识别:准确识别0~9的数字发音
- 指令识别:支持基础英语/波斯语指令的识别
- 多模式运行:
- 命令行版本:适合批量处理和脚本集成
- GUI版本:提供用户友好的可视化操作界面
- 实时录音识别:通过麦克风进行在线语音采集和识别
- 文件识别:处理预录制的音频文件(支持.wav等格式)
- 实时显示识别结果文本
- 提供置信度评分指标
- 图形化显示识别过程和分析结果
使用方法
启动系统
运行项目根目录下的
Start.m 脚本即可启动整个系统:
Start
操作指南
- 模式选择:启动后选择命令行模式或GUI模式
- 语言设置:根据需求选择英语或波斯语识别模式
- 输入方式:
- 实时录音:点击录音按钮开始说话
- 文件识别:选择要识别的音频文件
- 查看结果:识别结果将实时显示在界面或命令行中
- 帮助系统:系统内置操作指导,可随时查看使用说明
系统要求
- 软件环境:MATLAB R2018b或更高版本
- 操作系统:Windows 7/10/11,Linux或macOS
- 硬件要求:
- 内存:至少4GB RAM
- 存储空间:500MB可用空间
- 音频设备:支持麦克风输入(实时录音模式)
文件说明
main.m文件作为系统的核心控制模块,承担着多重关键功能:负责初始化语音识别环境参数,协调不同运行模式的选择与切换,管理音频输入源的选择与控制,调度DTW算法进行特征匹配计算,处理识别结果的生成与输出展示,并提供系统配置与帮助信息的集成管理。该文件实现了整个识别流程的主循环控制,确保各功能模块间的协同工作。