首页 > 范文大全 > 正文

声纹 让“芝麻开门”成现实

开篇:润墨网以专业的文秘视角,为您筛选了一篇声纹 让“芝麻开门”成现实范文,如需获取更多写作素材,在线客服老师一对一协助。欢迎您的阅读与分享!

手机能够智能辨识主人的声音进行解锁,一根手指头都不用动就能打开手机。如此炫酷的语音智能控制功能,让智能手机显得更通“人性”,那么手机是如何做到这些的呢?

声纹解锁技术原理

实际上,声纹解锁的原理就是建立声纹和声纹识别。第一是声纹注册,也就是通过用户的互动,建立一个语音的身份证;第二就是声纹识别,通过既有的声纹模型与当前的用户语音对比,看看是不是手机真正的主人。

在声纹注册阶段,用户需要对着手机念一段文字或者数字,手机会要求用户重复输入同样的语音三次,这有点类似于我们设定密码中的两次输入。而这三次语音输入,对于手机里的语音识别系统来说就是学习和建立模型库的过程,从而实现语音特征的提取。

在声纹识别阶段,用户只需要输入注册时使用的语音,通过手机系统的验证,就能实现语音解锁登录了。

通过上面的讲解可以看出,声纹识别的关键技术在于语音预处理后的特征参数提取技术,那么语音特征参数是如何提取的呢?

目前常用的语音特征参数的提取技术主要有以下几种:

一是语音频谱参数。这种参数的提取主要是基于说话人发声器官,如声门、声道和鼻腔等的特殊结构而提取出说话人语音的短时谱特征(即基音频率谱及其轮廓)。它是表征说话人声音的激励源和声道的固有特征,可以反映说话人语音器官的差异,而短时谱随时间或幅度变化的特征,在一定程度上反映了说话人的发音习惯。

二是小波特征参数。这种参数的提取是利用小波变换技术对语音信号进行分析处理以获得表示语音特征的小波系数。小波变换具有分辨率可变、无平稳性要求和时频域兼容表征等优点,能够有效地表征说话人的个性信息。因此,它在声纹识别系统中实际应用时体现出计算量小、复杂度低、识别效果好等特点,是近年来语音特征参数提取技术的热点。

简单来说,因为人的发声器官,包括声带、软颚、舌头、牙齿、唇等,存在着大小、形态及功能上的差异。这些差异会导致发声气流的改变,造成音质、音色的差别。此外,人发声的习惯亦有快有慢,用力有大有小,也造成音强、音长的差别。这些特征表现了不同声音的不同波长、频率、强度、节奏。而提取过程就是把声波的变化转换成电讯号的强度、波长、频率、节奏变化,保存下来并建成语音模型库。

声纹解锁的绝招

你一定会有这样的疑问,如果声纹提取时是在安静的环境中进行,要在充满噪声的环境中使用声纹解锁,识别系统还能正常工作吗?这里就不得不提到声纹解锁的绝招:噪音处置算法。

大家知道,即便在嘈杂的环境中,我们人类还是有一种超能力—可以将噪音当做耳边风,将注意力集中在对方说话的声音上。但是手机相对伟大的人类来说,这种能力绝不是与生俱来的。

所以声纹解锁功能有两个超级的语音处理能力。第一个是使用语音端点检测算法,探测用户输入语音的起始和终止位置,也就是说,哪怕外面吵翻天,但用户可能一个字都没有说。这种算法可以精确探测到用户说话到底说了哪一段,因此分析起语音来可以有的放矢。第二个是使用信噪比估计算法,检测用户输入语音的质量是否满足需求。如果背景噪声太强,就会提示用户重新输入。

其实,声纹识别的使用在军事或刑侦上经常用到,就拿我们熟悉的美国对伊拉克的战争来说,在美国第一轮“斩首”行动之后,伊拉克总统萨达姆马上发表电视讲话,鼓舞士气,同时证明自己的存在。此时,德国科学家分别从图像理解与分析、声纹识别两个方面证明发表讲话的就是萨达姆本人。这样一则不惹人注意的新闻消息背后,却有着一个不同寻常然而又为各国情报部门所大力研发的军事科技:声纹识别。无论萨达姆在何时何地发表不同内容的讲话,他的声纹始终是不变的,因此可以由此断定一种声音是否是其本人发出的。

目前,声纹识别在生活中的应用才刚刚开始,也许在不久的将来,声纹识别技术会有新的玩法。可以预见,“芝麻开门”的故事将越来越多。