基于DSP语音识别系统的设计(全文)

开篇：润墨网以专业的文秘视角，为您筛选了一篇基于DSP语音识别系统的设计范文，如需获取更多写作素材，在线客服老师一对一协助。欢迎您的阅读与分享！

摘要：语言是人类相互间进行通信的最自然和最方便的形式，语音通信是一种理想的人机通信方式。要使机器人真于具有人的智能，人机间的语音通信就必不可少。因此，进行语音控制的研究工作具有实际意义和应用前景。语音技术，包括语音识别、语音合成、关键词检出、说话人识别与确认、口语对话系统等，是现代人机交互的重要方式之一，具有广泛的应用前景。其中语音识别技术，尤其是连续语音识别技术，是最基础、最重要的部分，而且已经逐步走向成熟与实用。

关键词：语音识别；动态时间规整（DTW）；数字信号处理器（dsp）

1 引言

语音识别按不同的角度有以下几种分类方法：从所要识别的单位，有孤立词识别、音素识别、音节识别、孤立句识别、连续语音识别和理解。目前已进入识别的语音识别系统是单词识别。以几百个单词为限定识别对象。从识别的词汇量来分。有小词汇（10-50个）、中词汇（50-200个）、大词汇（200以上）等。从讲话人的范围来分。有单个特定讲话人、多讲话人和与讲话者者无关。特定讲话人比较简单，能够得到较高的识别率。后两者难度较大，不容易得到高的识别率。从识别的方法分。有模块匹配法、随机模型法和概率语法分析法。这三种都属于统计模式识别方法。

2 系统硬件及组成

2.1 系统概述

语音识别系统的典型实现方案如图1所示。输入的模拟语音信号首先要进行预处理，语音信号经过预处理后，接下来重要的一环就是特征参数提取，其目的是从语音波形中提取出随时间变化的语音特征序列。然后建立声学模型，在识别的时候将输入的语音特征同声学模型进行比较，得到最佳的识别结果。

2.2 硬件构成

本文采用DSP芯片为核心（图2所示），系统包括直接双访问快速SRAM、一路ADC/一路DAC及相应的模拟信号放大器和抗混叠滤波器。外部只需扩展FLASH存储器、电源模块等少量电路即可构成完整系统应用。

2.3 系统主要功能模块构成

语音处理模块采用TI TMS320VC5402， TMS320VC5402含4 KB的片内ROM和16 KB的双存取RAM，一个HPI（HostPortInterface）接口，二个多通道缓冲单口MCBSP（Multi-Channel Buffered SerialPort），单周期指令执行时间10 ns，带有符合IEEE1149.1标准的JTAG边界扫描仿真逻辑。语音输入、输出的模拟前端采用TI公司的TLC320ADSOC，它是一款集成ADC和DAC于一体的模拟接口电路，并且与DSP接口简单，性能高、功耗低，已成为当前语音处理的主流产品。16位数据结构，音频采样频率为2～22.05 kHz，内含抗混叠滤波器和重构滤波器的模拟接口芯片，还有一个能与许多DSP芯片相连的同步串行通信接口。TLC320AD50C片内还包括一个定时器（调整采样率和帧同步延时）和控制器（调整编程放大增益、锁相环PLL、主从模式）。TLC320AD50C与TMS320VC5402的硬件连接，如图3所示。

3 结论

本文以TMS320VC5402芯片为核心的系统硬件设计迸行了研究，通过TLC320AD50C对语音信号进行A/D转换，通过TMS320VC5402对语音信号“0”、“1”、“2”进行训练和识别，并由对于灯LED0、LED1、LED2亮来显示结果是否正确；该系统核心识别算法采用动态时间规整（DTW）算法，主要流程包括预处理、端点检测、提取特征值、模式匹配和模板训练，取得了很好的识别效果。

参考文献

[1] 朱铭锆，赵勇，甘泉. DSP应用系统设计 [M].北京：电子工业出版社，2002.

[2] 郭华. 自适应滤波算法及应用研究[D].兰州：西北师范大学，2007.

[3] 张雄伟..DSP芯片的原理与开发应用[M].北京：电子工业出版社，2009.

[4] 张德丰. 数字图象处理（MATLAB版）[M].北京：人民邮电出版社，2009.

作者简介

王宇，邵阳学院魏源国际学院电子科学与技术专业学生。

通讯作者

彭森，邵阳学院信息工程系教师。

基于DSP语音识别系统的设计

优秀范文

精选范文