开篇:润墨网以专业的文秘视角,为您筛选了一篇语音信号基音检测算法研究范文,如需获取更多写作素材,在线客服老师一对一协助。欢迎您的阅读与分享!
摘要:本文对倒谱法做了改进,在用倒谱法进行基音检测分析时,提出了一种功率谱二次处理的二次谱减法,该方法克服了倒谱法基音检测的抗噪能力低的弱点,在相同噪声环境下能更加精确地检测出语音信号的基音周期。
关键词:语音信号 基音检测 倒谱法 二次谱减法
1、引言
近年来,基于线性预测和分析频谱的Mel倒谱系数在处理包含情感的语音识别中取得了很大的进步,能否把此种方法应用到相应状态下的基音检测中去,值得广大学者研究。国外很多学者采用实时监控情感变化,并把影响修正基音的轨迹加以平滑或者动态改变窗的宽度,可以明显降低上述影响。基音检测一直是语音信号处理的一大难题,短时自相关函数法、短时平均幅度差函数法、倒谱法、小波变换法等传统的经典基音检测方法,都有各自的用场,但同时也有其相应的不足。其中任一种方法都不能作为通用的方法,但若在基音检测过程中,对预处理和后处理上进行一些改进,且突破传统的语音模型,并适当考虑说话人的个体特征及发音时的情感力度对基音检频带内谱包络测的影响,定能提高基音检测的准确性及健壮性。
本文以语音信号的基音检测为研究对象,着重分析自相关函数法和倒谱法,通过改进实验算法,达到理想的基音检测效果。
2、传统基音检测算法
2.1 短时自相关函数法
含有有限能量的语音信号的短时自相关函数定义为,其中,为移位距离,是偶对称的窗函数。
短时自相关函数法基音检测的原理主要是利用短时自相关函数的这一性质,通过比较原信号和它移位之后的信号之间存在的类似性来确定其基音周期,如果移位距离与基音周期相等,那么,这两个信号就具有最大类似性;或者是直接找出短时自相关函数的两个最大值之间的距离,便可作为基音周期的初估值。
2.2 倒谱法
倒谱法的定义为,时间序列的z变换的模的对数的逆z变换,该序列的倒谱的傅里叶变换形式为。落实到具体实现时,采用DFT来近似傅里叶变换,根据传统语音产生的模型及语音信号的短时性。在其频域内,语音信号短时谱等于激励源的频谱与滤波器的频谱的乘积,浊音信号短时谱中包含的快变化周期性细致结构,则必会对应着周期性脉冲激励的基频以及各次谐波。语音的倒谱是将语音的短时谱取对数后再进行IDFT来得到,所以浊音信号的周期性激励如果反映在倒谱上,便是同样周期的冲激。藉此,我们可从得到的倒谱波形中估计出基音周期。一般我们把倒谱波形中第二个冲激,认为是对应激励源的基频,即基音周期。下面列举出一种倒谱法求基音周期的框图(见图1) 。
3、改进算法的基音检测
当用无噪声的语音信号时,采用倒谱法进行基音检测还是很理想的。但是有加性噪声存在时,对数功率谱中的低电平部分会被噪声填满,从而掩盖了基音谐波的周期性。这也意味着倒谱的输入不再是单纯的周期性成分,而导致倒谱中的基音峰值变宽,而且受到噪声的污染,最终导致倒谱检测方法的灵敏度也随之下降。为此,本文提出了如下改进方法(图2):
此方法避免了用倒谱法做基音检测过程中求对数,这样可以减少所涉及的非线性计算,也就减少了计算量,是一种二次谱的处理方法,由于浊音线状谱的原因,导致了其二次谱的周期性,因此,在其二次谱频率轴上,除去零频外的某一特定点便会出现一个最大的谱峰。但高斯白噪声 Wn在作二次谱处理后却是不具有这些性质的。为此,在理论上,通过这个二次谱频率不为零的最大谱峰值,即其横坐标值,便可估计出浊音周期。
改进后的二次谱减法比倒谱法的抗噪性能要好,在相同噪声环境下能更加精确地检测出语音信号的基音周期。
4、结语
本文以语音信号的基音检测为研究对像,对短时自相关函数、倒谱法、这两种基音检测的方法的原理进行了分析。在此基础上,深入研究了倒谱法基音检测的算法。通过实验仿真,发现这种测量方法的不足;最后对这种算法进行了改进,在用倒谱法进行基音检测分析时,提出了一种功率谱二次处理的二次谱减法,该方法克服了倒谱法基音检测的抗噪能力低的弱点,在噪声环境相同的情况下能更加准确的检测出语音信号的基音周期,从而有效提高算法在基音检测时的准确性和抗噪性。
参考文献
[1]胡航.语音信号处理[M].哈尔滨:哈尔滨工业大学出版社,2000:116.126.
[2]韩纪庆,张磊,郑铁然.语音信号处理[M].北京:清华大学出版社,2004,lO.39.
[3]赵力.语音信号处理[M].北京:机械工业出版社,2003:24.40.
[5]陈小利含噪语音基音周期检测算法研究[D].信息工程大学,2007.