首页 > 范文大全 > 正文

基于发音动作的中英文元音交叉语言对比研究

开篇:润墨网以专业的文秘视角,为您筛选了一篇基于发音动作的中英文元音交叉语言对比研究范文,如需获取更多写作素材,在线客服老师一对一协助。欢迎您的阅读与分享!

摘要: 本文通过电磁发音仪(Electro Magnetic Articulography,EMA)AG500,以200帧/秒的采样率采集了英语和汉语的标准发音动作数据,然而,交叉语言比较的首要任务就是要消除特定说话人声道特性及其它个人生理特性等音素而引起的固有差别,本文采用了基于说话人归一化的普氏算法来进行说话人归一化处理,获得了英汉相似音素发音的元音对比最小对,最后成功揭示了2种语言易混淆元音发音文本对在口腔内外发音动作上的区别。

关键词:发音动作; 电磁发音仪(EMA)AG500; 中英文交叉语言; 普氏变换; 对比最小对

中图分类号: TP393

文献标志码: A

文章编号: 2095-2163(2016)06-0081-03

0引言

语音是一种多模式的通信形态,包括视觉、听觉、触觉等自然模式,以及大脑电极活动、电磁活动等非自然模式[1]。除了整体表现出物理属性和社会属性外,语音还具有相应的生理属性[2]。近年来,随着发音动作观测技术的快速发展,越来越多的研究开始关注语音的生理属性,语音可视化就是在上述背景下得以创立并已进入深度探索的一门重要的基础功能技术。

在众多发音动作观测的新技术中,电磁发音仪(Electro Magnetic Articulography,EMA)是研究微小复杂动作的专用设备。该仪器可逼真模拟多数情况下不易察觉的舌头、软腭等发音器官运动的发音动作[3]。

为了纠正英语和普通话发音中的常见错误,需要生成英汉双语的发音文本,从而有效地帮助母语为汉语的学习者学习英语发音,反之也可同样帮助母语为英语的学习者学习汉语普通话。另外,根据第二语言学习的有关研究可知,母语对第二语言的学习有一定的副作用[4],例如,当以汉语为母语的主体在学习英语时,那些英语音素常会被一个母语中的类似音素替代。

综合以上分析论述可知,有必要通过交叉语言对比的方法探寻得到英语和汉语中易被第二语言学习者错发或漏发的发音文本对,并有针对性地展开交叉对比研究。本文即针对这一研究内容给出如下阐释分析。

[BT4]1经验法获得中英文三维发音动作文本

为了获得一个双语的EMA发音动作数据库,提取中英文发音动作的特征,分别采集了普通话和英语的三维多通道EMA发音动作数据,数据采集者分别是2名本土的女性说话人。

首先,研究以《英语发音字典》[5]、《语音学》[6]、《标准汉语》[7]和《标准汉语语音学》[8]为准则选出2种语言有的音素(汉语中不存在的英语音素以及英语中不存在的汉语音素,及其相近音素)。表1中列出了这些音素,表中的所有音素都用国际音标(International Phonetic Alphabet,IPA)的符号规范书写。

由表1中的音素对可知,经验的易混淆元音音素包括5个中文元音、7个英文元音,共计12个易混淆的元音音素。这些音素对在听觉上将难于辨识,然而,其舌头和唇部的发音动作却存在着明显差异。各音素对的图形对比如图1所示。

图1描绘了中英文的元音的相似音素的静态帧和关键帧,图中所有音素的静态帧都选为同一帧,用虚线标示;英语音素的关键帧用实线标示;而普通话的关键帧用点划线标示。图中用T1、T2、T3分别标示了舌尖、舌体和舌后3个数据采集点,而用L1、L2和L4分别标示了左嘴角、上唇和下唇3个离散数据采集点。

分析图1可知:这些易混淆的音素具有相同的发音部位,但是其发音方法和发音动作(包括唇形、舌位舌头与牙齿或上颚的接触程度等)却截然不同。这与已有的经验分析结果也是一致的,例如:在元音的学习中,很多中国学生不能正确区分松元音(lax vowels)和紧元音(tense vowels),认为二者的区别仅仅是发音时长的不同,却忽略了英语中的元音具有更加复杂的舌位。

因此,有必要进一步在发音动作的层面上区分这些易混淆的因素对,揭示这些易混淆音素对的内在联系和区别,帮助第二语言学习者训练并归结到准确发音。

[BT4]2基于说话人归一化的普氏变换

为了证实由经验得到的中英文易混淆发音文本对,并精确衡定这些易混淆发音文本对,从而揭示这2种语言相似发音文本在发音动作上的根本区别,则需要进行量化的交叉语言比较。然而,量化的交叉语言比较的一个主要的问题是如何克服、且消除由说话人本身的特性(包括由特定说话人声道特性及其它个人生理特性等因素)所带来的固有差别。

基于这一研究需求,本文采用了基于说话人归一化的普氏变换(Procrustes transformation)算法。该算法是由原多点物向目标多点物的线性几何变换,普氏变换由旋转变换、尺度变换和平移变换组成,其误差度量是最小均方根误差[9]。

假设研究时需将原说话人的发音动作数据D1变换到目的说话人的发音动作数据D2,而D1的归一化数据为D3;由旋转变换、尺度变换和平移变换组成的混合变换则如公式(1)所示:

[HT5SS]D3=[WT5HX]H[WT5BX]D1a+b[HT5”SS][JY](1)

其中,归一化参数([WT5”HX]H[WT5”BX],a,b)由目标数据D2和原数据的归一化数据D3之间的最小均方根误差进行优化。

具体地,旋转矩阵[WT5”HX]H[WT5”BX]可通过奇异值分解得到:

[HT5SS](D1′)TD2′=[WT5HX]U[WT5BX][WT5HX]V[WT5BX]T[HT5”SS][JY](2)

[HT5SS][WT5HX]H[WT5BX]=[WT5HX]V[WT5BX]Λ[WT5HX]U[WT5BX]T[HT5”SS][JY](3)

式中,是角矩阵,[WT5”HX]U[WT5”BX]和[WT5”HX]V[WT5”BX]是正交矩阵,Λ是对角线元素绝对值为1的对角矩阵,对角线元素的符号取决于矩阵相应位置处的元素符号。

κ据定制设计了归一化处理后,就消除了不同说话人的固有差别,接着需要形成一个说话人无关的发音空间(speaker independent articulatory space),从而在这个统一的说话人无关的发音空间上进行易混淆的中英文发音文本对的分析比较。

分层聚类分析算法(Hierarchical Clustering Analysis, HCA)和多维标度定位算法(Multi-Dimension Scaling, MDS)是将交叉语言音素之间的差异实现可视化的有效方式。

本文采用多维标度定位算法进行了量化比较,将英语和汉语中的音素之间的差距在一个跨语言的语音空间上给出了可视化展示;同时采用分层聚类分析算法对2种语言的相似音素提出了聚类分析的描述结果。经由上述处理,归一化的数据就形成了一个说话人无关的发音空间。

3结束语

由于英语和汉语这2种语言中有些发音是极为相似的,这些相似的发音会经常将外语初学者带入漏读或者错读,为了更加有效地帮助以汉语为母语的学习者练习英语发音以及帮助以英语为母语的学习者练习普通话发音,本文针对2种语言的特点,进行了基于最小音素对的交叉语言对比。利用说话人无关的普氏算法消除了说话人声道特性本身的固有差别,产生了英语和汉语中易被第二语言学习者错发或漏发的元音发音文本对。

参考文献:

HERACLEOUS P, BADIN P, BAILLY G, et al. Exploiting multimodal[JP] data fusion in robust speech recognition[C]//Multimedia and Expo (ICME),2010 IEEE International Conference on. Suntec City,Singapore: IEEE, 2010: 568-572.

[2] 黄伯荣, 廖序东. 现代汉语[M]. 北京:高等教育出版社, 2002: 1-138.

[3] [JP3]SUMBY W H, POLLACK I. Visual contribution to speech[JP] intelligibility in noise[J]. Acoustical Society of America, 1954, 26: 212.

[4] [JP3]苏留华. 母语迁移对第二语言学习的影响[J]. 北京第二外国语学院学报, 2000(4): 44-52.[JP]

[5] JONES D, ROACH P, HARTMAN J. English pronouncing dictionary[M]. Cambridge, UK:Cambridge University Press, 2006.

[6] BALL M J. PHONETICS―The science of speech[J]. Acoustical Society of America Journal, 1999, 108(6): 2695.

[7] LEE W S, ZEE E. Standard Chinese(Beijing)[J]. Journal of the International Phonetic Association, 2003, 33(1): 109-112.

[8] DUANMU S. The phonology of standard Chinese[M]. USA:Oxford University Press, 2003.

[9] GOWER J C. Generalized procrustes analysis[J]. Psychometrika, 1975, 40(1): 33-51.