首页 > 范文大全 > 正文

基于随机共振的基音周期估计方法

开篇:润墨网以专业的文秘视角,为您筛选了一篇基于随机共振的基音周期估计方法范文,如需获取更多写作素材,在线客服老师一对一协助。欢迎您的阅读与分享!

摘要:基音周期估计是语音处理和分析的最基本步骤。无论是做语音信号处理,语音压缩,还是语音识别,都要用到基音周期这一重要参数。文章基于随机共振的理论,提出了一种新的估计基音周期的方法。

关键词:基音周期;语音;随机共振

中图分类号:TP334文献标识码:A文章编号:1009-3044(2011)13-3140-02

A Method of Pitch Estimation Based on the Theory of Stochastic Resonance

HE Zhao-xia, LIU Kai

(Yangtze University College of Technology & Engineering, Jingzhou 434023, China)

Abstract: Pitch estimation is the basic step in speech processing and analysis.Whether to do speech signal processing, speech compression, or speech recognition, It is necessary to use pitch estimation which is a important parameters. A new method of pitch estimation is proposed based on the theory of stochastic resonance.

Key words: pitch estimation; speech; stochastic resonance

所谓基音周期就是指当发浊音时,气流通过声门时使声带发生振动,产生的准周期激励脉冲串的周期,其倒数称为“基音频率”。[1]在实际中,说话人努力保持基音和声道形状的情况下,基音周期也都不能够保持固定,而是随时间随机的变化的,这一特性称为基音的“抖动”;此外,在一个音中,相邻的几个基音周期的声门波幅度也会有变化,这一特性称为幅度“闪烁”。在语音分析中,为了解释连续的周期声门波的变化会按周期交替出现或者近似随机的出现,基音的“抖动”和“闪烁”现象被推测为由一个潜在的稳定系统或混沌系统引起的非线。[2]

根据基音的这些特点,作者考虑利用非线性随机共振原理估计语音信号的基音周期。实现随机共振需要三个基本条件,即非线性系统、输入信号和噪声,它分利用信号、噪声与非线性系统的协同作用实现弱周期信号频率的提取。进一步的研究发现,利用参数调节可检测大信号的频率[3]。从语音产生的机理出发,我们知道产生语音的生源主要分为三种:周期性、噪声和冲击性生源,而且这三种生源经常混合出现[1],所以可以利用随机共振的原理分析和处理语音信号。

1 基于随机共振的基音周期估计方法

根据人耳的听觉机理及非线性随机共振理论,我们前期已用如下的模型来提取说话人语音的基本特征[4],如图1所示。

通过适当选取非线性随机共振参数,说话人语音信号通过系统后,可转变为具有说话人个体特征的周期性信号,也就是从说话人信号中提取了浊音的信息。由于此时获得的信号严格上将不是准周期的,而且也是有限长的,所以理论上可以考虑用离散傅里叶变换(DFT)来获取它在频域上的特征。图2为基于随机共振的基音周期估计方法的原理图。

图2中,预处理部分包括抗混叠滤波和预加重,抗混叠滤波指滤除高于1/2采样频率的信号成分或噪声,一般用低通滤波器实现。为了提升高频部分,使信号的频谱变得平坦,将滤波后的信号经过预加重数字滤波器H(z)=1-0.9375z-1。非线性随机共振系统是由几个数字滤波器并联而成,构成耳蜗的模型。通过该系统后的信号每帧10个点,帧移5个点,加汉明窗。最后就是进行DFT变换,由于基音频率的分布范围为50―450Hz,所以将采样频率设为900Hz、采样点512个进行基音频率的估计。

2 实验与分析

实验采用自己录制的录音,录音人数为10人,其中5男5女,录音内容为数字和简单的词语。将基于随机共振的基音周期估计方法在MATLAB2008a环境下进行仿真设计。

图3为录音内容为“0”的男生语音波形,图4为最后输出的频域波形图。从图四中,我们可以准确的读出该语音的基音频率260Hz,那么基音周期就为(1/260)s。

图3 男生“0”语音波形图 图4 男生“0”语音频域图

同时,还将男生和女生的基音频率作了对比,如图5为同一男生在不同时刻说话内容为“开门”的频域图,图6为同一女生在不同时刻说话内容为“开门”的频域图。从图中,我们可以看出,同一人在不同时刻讲述相同的内容,其基音频率也不完全相同,此外,女生的基音频率高于男生。

图5同一男生同一语音频域图 图6同一男生同一语音频域图

3 总结

本文介绍了基于随机共振的基音周期估计方法,通过实验仿真能够准确估计出基音频率,从而算出基音周期,为提取基音周期提出了一个新的研究方向。

参考文献:

[1] 张雄伟,陈亮,杨吉斌.现代语音处理技术及应用[M].北京:机械工业出版社,2003:7-34.

[2] Quatieri T F.离散时间语音信号处理[M].赵胜辉,刘家康,谢湘,译.北京:电子工业出版社,2004:42-82.

[3] 陈晓霞,王辅忠.利用参数调节随机共振检测大参数信号[J].天津工业大学学报,2008,27(4):60-64.

[4] 潘平,杨平,何朝霞.基于随机共振的说话人识别方法[J].电信科学,2010(S2).

注:本文中所涉及到的图表、注解、公式等内容请以PDF格式阅读原文