基于分形维数的音乐自动分类方法(全文)

开篇：润墨网以专业的文秘视角，为您筛选了一篇基于分形维数的音乐自动分类方法范文，如需获取更多写作素材，在线客服老师一对一协助。欢迎您的阅读与分享！

摘要：音乐的自动分类是现代检索技术的一个研究内容，也是音乐可视化研究中亟待解决的问题。近年来，音乐的分形性质已得到了广泛的研究。本文是从分形的角度对音乐的自动分类问题进行研究，提出了一种基于分形维数的音乐自动分类方法：通过对不同风格音乐的分形维数的计算与比较，确定音乐分类的范围指标，然后利用此指标作为依据对音乐进行自动分类。本文通过实验证明此方法具有使用简单、高效和高准确率的特点。

关键词：分形技术；分形维数；音乐自动分类

中图分类号：TP391 文献标识码：A DoI: 10.3969/j.issn.1003-6970.2012.03.006

Music Automatic Classification Approach Based on Fractal Dimension

SUN Bowen1, ZHANG Yanpeng2, ZHAO Zhenguo3, Gao Chao3, MENG Fanbo4

【Abstract】 Music automatic classification is one domain of study in modern search technology, and also the problems urgently to be solved in music visualization. In recent years, the fractal nature of the music has been widely studied. This article which researches into music automatic classification from the fractal point, proposes a new methodology of music automatic classification based on fractal dimension: Determine the indicator of the scope of music classification from calculating and comparing the fractal dimensions of different music styles, then do music classification with this indicator. In this article, it is proved by experiments that this method is efficient, simple to use and with high accuracy.

【Key words】Fractal technology; Fractal Dimension; Music Automatic classification

0 引言

随着计算机技术和通信技术的飞速发展，各式各样的信息急速的增长，人们也时时刻刻的能接触到大量多媒体形式的内容，如图像、音频、视频等。但是随着数据量的快速增长，如何自动对这类内容进行快速管理就成为了一个亟待解决的问题。特别是对身边大量的音乐信息，人们需要快速高效的方法对它们进行分类和管理，以便更好的应用在音乐推荐、KTV点唱及在线选歌等诸多领域中。

伴随着语音识别技术的火热发展，许多其它领域的方法被应用到音乐分类领域之中。然而，由于音乐的多样性和不确定性，基本上所有的方法与大规模的实际应用都还有不小的距离。目前绝大多数音频分类算法集中在两方面――音频的特征提取以及根据音频特征进行分类。现有的音频特征算法有：短时过零率、时域的短时能量、谱质心分析、频域带宽等，还有基于听觉感受的MFCC(Mel-frequency cepstral coefficients)梅尔倒频谱系数等。另一方面，分类算法可利用模式识别和模式分类中已知算法，如CMM(Gaussian mixture model)高斯混合模型[1]、NN(Neural Network)神经网络、HMM(Hidden Markov Model)隐马尔可夫模型[2-6]等。

本文是从一个全新的角度，即分形的角度对音乐的自动分类问题进行研究，提出了一种基于分形维数的音乐自动分类方法：通过对不同风格音乐的分形维数的计算与比较，确定音乐分类的范围指标，然后利用此指标作为依据对音乐进行自动分类。实验证明此方法使用简单，并具有较高的分类精度。

1 音乐与分形

古典音乐最低，嘻哈音乐最高。且本方法对于乡村音乐的区分度准确率最高，嘻哈音乐次之，古典音乐最低。

在古典音乐的测试中，绝大部分分类错误的音乐都分类在了乡村音乐中，只有少部分音乐分在了嘻哈音乐中。同样的在嘻哈音乐的测试中绝大部分分类错误的音乐都分类在了乡村音乐中，只有极少部分音乐分在了古典音乐中。再综合三类音乐的分形维数递增，这就可以说明此三种音乐的分类想要跨越中间音乐类型不是很容易。

本方法对三种音乐类型的分类结果准确率较高，且本身方法简便，实现程序运算速度快，可以实现音乐的快速自动分类。

4 结论

本文提出利用音乐的分形维数作为音乐的特征进行音乐分类的方法，并着重将整首音乐进行统一处理的研究思路，其优势在于只用一维特征就能区分音乐的不同类型，即分形刻画了音乐的内在特征――部分与整体的相似性。该方法具有应用简单、分类准确度高、速度快等优点。然而，该方法对音乐的分类还存在不足，如分类不够精细，部分音乐的维数很接近等。所以在以后的工作中要对除振幅外的其他音乐特征进行进一步研究，再适当结合其他分类方法的基础上，充分利用多维向量来进行音乐或音频的分类，以便提高音乐分类的精细程度，达到更好的分类效果。

参考文献

[1] 肖健华.智能模式识别方法[M].北京:华南理工大学出版社，2006.

[2] 卢坚，松，孙正兴.语音/音乐自动分类中的特征分析.计算机辅助设计与图形学学报，2003,14(3):233-237.

[3] Bailiang , Laosongyang, Chenjianyun, Wulingda. Feature Analysis and Extraction for Audio Automatic Classification[A]. Systems, Man and Cybernetics[C], 2005 IEEE International Conference on, China, 2005,1:767-772.

[4] J.Ajmera, I.A.Mccowan, H.Bourlard. Robust HMMBased Speech/Music Segmentation. IEEE Proc.ICASSP[C], Orlando, USA.2002,5:297~300.

[5] L.R.Rabiner.A Tutorial on Hidden Markov Models and Selected Application in Speech Recognition[A]. Proc.Of IEEE,Iss.2[C],1989,77:257-286.

[6] 庄越挺，毛炜，吴飞.基于隐马尔科夫链的广播新闻分割分类[J].计算机研究与发展，2002，9(9)：1057-1063.

[7] Voss R.F,Clarke J. 1/f noise in music and speech[J]. Nature,1975,258:317-318.

[8] Voss R.F, Clarke J. ”1/f noise” in Music: Music from 1/ f Noise[J]. J. Acoust. Soc. Am. 1987,63(1):258-263.

[9] Traina C , Jr Traina A. Fast features selection using fractal dimension[A]. Proc of XV Brazilian Database Symposium on Database[C]. Berlin，2000：158-171.

[10] 鲍玉斌，王琢，孙怀良等.一种基于分形维的快速属性选择算法[J].东北大学学报，2003，24（6）：527-530.

[11] 郭平，陈其鑫，王燕霞.基于分形维数的属性约减[J].计算机科学，2007，34（9）：189-190.

基于分形维数的音乐自动分类方法

优秀范文

精选范文