首页 > 范文大全 > 正文

人声浊音基频测量谱分析算法

开篇:润墨网以专业的文秘视角,为您筛选了一篇人声浊音基频测量谱分析算法范文,如需获取更多写作素材,在线客服老师一对一协助。欢迎您的阅读与分享!

摘要:人声基频检测是一个普遍关心的技术问题,目前所采用的方法也很多。利用数字信号处理的方法,通过对人声的浊音部分进行功率谱分析的方式,采用一种检查共振峰位置,进而遏止共振峰,在频域中凸显基波频率的方法,在频域确定信号的频率,从而自动检查出信号的基频

关键词:浊音;基频;DSP;功率谱;共振峰

中图分类号:TN912

文献标识码:B

文章编号:1004―373X(2008)04―113―02

1 算法概述

一般来说,声音信号浊音部分,去其头尾,可以看作是平稳的随机信号。当然,可以用频谱分析仪来观察信号频谱,在频谱图上寻找频率最低的谱峰来确定该段频率的基频。同样,用时域分析的方法,比如相关函数。类似这样的方法还有很多。但是,如果用一种算法实现功率谱中基频的自动测量有一定的困难,无法用功率谱中某一个特征值(与其谐波有着明显的数值差距)。由于共振峰影响,其功率谱表现出基频分量大小并不一定为其频率分量中的最大值。所以,很难依靠一种功率谱值比较的方法来估计其基频。

这里提供一种相对较容易实现,算法简单的检波滤波的方法,利用数字信号处理的基本理论,依靠经典功率谱分析方法,其具体思路如下:

首先,截取一段录制好的声音文件(这里采用,WAV格式的文件,采样频率为22.05 kHz),取2 048个采样点(便于进行FFT),大约100 ms。如果信号的噪声干扰不大,可以采用周期图谱法。如果噪声比较大,可以考虑用现代谱分析的方法,比如AR模型,以及类似的方法(普通话筒近距离录音,噪声影响不大)。

其次,在对这段数据进行谱分析前进行预处理,之后进行周期图谱分析,在该图谱中找出最大值,找出该最大值对应的数据位置。根据数据位置和数字频率与模拟频率的对应关系,容易算出该谱峰对应的频率,这个频率通常是该信号的谐波频率,在声音信号中一般来说,其主要的谐波分量为其第二或第三次谐波。

最后,设计一个数字检波滤波器,对照数字频率与模拟频率之间的关系,以最大值的数据位置设计滤波器,以该频率为阻带下限截止频率,以该频率的1/2为通带截止频率的数字低通滤波器,对该信号进行滤波。

在通常情况下,要重复上述方法2次。这样再进行周期图谱分析,找到最大峰值所对应的点;根据数字频率和模拟频率的对应关系ω=ΩT(ω,Ω分别为数字和模拟角频率),换算出该数字频率对应的模拟频率,这个模拟频率就可以被认为是这段浊音信号的基频。

2 算法流程

算法的基本流程如图1所示:

图1中,在功率谱中寻找最大值时所对应的频率实际上并不是ω,而是对应的数组下标i,所以要根据数字频率及模拟频率的变换关系ω=ΩT以及FFT的变换长度N来换算ωi,具体换算关系为ωi=Ωs/N×i,其中Ω为采样角频率。另外,滤波器参数按照频率π归一化设计,归一化截止频率为ωi=2i/N。

3 实验结果

以下是一些实验结果,对2个元音(其基音频率为220 Hz)。

图2是对元音/i/的频谱分析和为信号的时域波形,图3为该元音的周期图谱和经过一次检波滤波后的周期图谱,可以清楚的看到,对于男性发出的/i/的元音经过一次检波滤波就能够使比较大的二次谐波分量相对基频分量变的较小。

图3是元音/u/的周期图谱,可以看出其基频分量相对二次谐波分量要小的多,图4是经过一次检波滤波的周期图谱,其基频分量还是相对二次谐波分量要小,图2中是对经过一次检波滤波的声音信号进行二次检波滤波。从图中可以看出经过两次检波滤波谐波分量相对基频分量已经十分小了,从而可以在图谱中找到最大值对应的位置换算出基频分量。

4 分析说明

(1)由于只是说明方法的实验,这里采用的抽样频率比较高,并且有着相对比较大的计算量。实际应用时可以采用8 kHz的采样频率,也可以根据不同的需要采用其他的采样频率。

(2)对声音信号要进行预处理,过滤低于60 Hz高于3 000 Hz的频率分量。

(3)对于滤波器的选择,建议选择Butterworth滤波器,原因是该滤波器具有平滑单调递减的频率响应(这一点在本方法中十分重要),并且滤波器设计简单,无需考虑线形相位的要求(这里只是幅频分析)。使用这种滤波器最好能够调整其阶数,阶数不宜过高,因为并不希望滤波器的过渡带过于陡峭,同时阶数过高会使计算量过大,对实时处理不利。

要说明的是,如果待检测信号的频率在第一次检波时找到的就是基频,那么即使是经过二次检波滤波,重复检波滤波其峰值的相对位置也是不会发生变化。以下是对分析图一经过两次检波滤波后的结果:

由图1,图3可以看出,虽然经过一次检波滤波基频分量已经大于谐波分量了,但是经过二次检波滤波之后并没有影响分析结果,基频分量依然相对大于谐波分量。

总结以上介绍,该方法的优点是:方法简单,理论成熟,可以自动调整数字滤波器的参数,无需对功率谱进行观察,进而分辨该段信号的频率,判断平稳信号的基频。