首页 > 范文大全 > 正文

微软的音乐细胞

开篇:润墨网以专业的文秘视角,为您筛选了一篇微软的音乐细胞范文,如需获取更多写作素材,在线客服老师一对一协助。欢迎您的阅读与分享!

“音乐导航”技术作为微软亚洲研究院众多的创新的细胞之一,正被植入微软的未来。

一杯茶、一本书,Allan坐在阳台上的藤椅上,iPod里小野丽莎在低吟浅唱,一曲过后,传来诺拉・琼斯慵懒的声音,Allan在柔和的歌曲中过了一个惬意的下午。健身时,充满朋克风格的摇滚乐最适合Allan挥洒汗水……微软亚洲研究院的技术正在让机器变得如此聪明,你欣赏的音乐风格可能是R&B或蓝调、你也许在开车或是在慢跑,微软音乐导航技术会为你挑出最适合当下情景的音乐,在与机器的交互中,科技与人产生了共鸣。

“我工作的大部分时间都在跟声音打交道。”微软亚洲研究院语音组芦烈博士用一曲情歌代替了开场白。他拿着手机,把嘴凑到手机声筒边,眯着眼睛唱“你问我爱你有多深,我爱你有几分”,几秒钟后,储存在手机里的邓丽君的《月亮代表我的心》就被自动搜索出来。

用人哼唱出的曲调来找歌的技术,只是芦烈和他的研究团队众多语音、音乐研究课题中的一个。

从2002年起,微软亚洲研究院就开始了关于节奏分析、音乐分类、音乐情绪检测一类的基础性研究。有了一定的积累后,2005年左右开始考虑怎么把这些功能集成起来,从而做成一个方便的应用。整个过程中,芦烈和同事们不断搜集用户的反馈,分析人们听歌的习惯。为了让用户体验更酷、更方便,芦烈已经记不清有多少次与研究院的设计师们讨论界面设计细节了。

音乐是突破了国界和语言的,与人们产生的是情绪上的共鸣,现在,芦烈和同事们愈发偏执地为他们的音乐梦想努力,他们希望做“读懂”音乐的人,再让音乐“读懂”人们的心。于是,就有了开头的一幕。

心有灵犀的播放器

人们常常遇到Allan的情况――当你有几千首歌储存在音乐播放器中(比如Zune,iPod,和智能手机),如何选择想要听的音乐便成了一个问题。“你可能没有时间从中选择所有想听的音乐;而且在不同的时候也想听不同的音乐。目前音乐播放器提供的‘shuffle’功能,基本上是随机播放音乐,只能满足用户最基本的需求。”于是,芦烈和同事们想到了用“音乐导航”技术来解决这个问题。

“音乐导航提供给用户一种‘smartshuffle’功能,用一种便捷的方式来选择和欣赏音乐。”芦烈对记者介绍,通过“音乐导航”,用户可以只选择一首音乐,系统就会自动生成一个“音乐电台”,推荐给用户一些相似的音乐。用户还可以通过音乐筛选来选择适合不同场景下听的音乐,比如在阅读时听柔和的音乐。这个过程就好像机器会先猜测你的喜好,列出一个初步的菜单。用户可以欣赏推荐的歌曲,也可以作进一步筛选,选择喜欢或删除不喜欢的歌曲。机器会基于用户对于音乐的移除等行为反馈,进一步分析用户的音乐偏好,自动调整组合歌曲推荐列表(电台中的音乐),使推荐的音乐越来越接近于用户的“口味”。通过音乐内容分析、推荐和筛选,交互式生成音乐列表,用户就可以方便地找到想听的歌曲。

一首简单的歌

在芦烈和他的同事们看来,即使是很简单的一首歌,也包含着多重音乐要素,包括风格、乐器、音调、旋律和节奏等。这样看来,所有曲子都并不简单。 一种做研究的惯性使得芦烈在听歌时,耳朵自然而然变成一把锋利的解剖刀,把每首歌的情绪、节奏、乐器、音色等重新解构。 “现在,我们会选择十种要素来表征音乐的特性。把这些因素量化、检测和分类之后,形成一个大体的框架,基本上就可以实现对音乐的描述。比如音乐风格,会分为流行、乡村、摇滚、蓝调等十几种;乐器也会区分十几种;音乐情感会有正面积极的感情、负面悲伤的感情和自然的中性表情三种;节奏的强弱和速度的快慢也量化为三种等等。”

在分析音乐的时候,最困难的就是多种乐器,多重旋律都混合在一起,很难把它们分离开来。不同的风格会用不同的乐器,每首歌里的起承转台又非常复杂。而且,在学术界甚至没有对音色的一个标准的定义。所以只能不断尝试提取特征来表征不同的音乐要素。

芦烈进一步向记者介绍道,作为一种算法,希望它能学习哪些要素在音乐中更加重要,这样就能更准确的分析用户偏好,现在就有算法正在做这个事情。另外,有时用户对想要听的歌只有一个粗略的概念,比如说想要听一些优雅的歌,这时,mood filter(音乐筛选器)就可以帮助用户设置选择。同时,用户还可以通过一些预先设定的场景,比如在睡觉前,运动时,和阅读时,来找到符合自己场景的歌曲。这些,有的还是概念性的想法,正在芦烈和同事们的不断努力下越来越接近现实。

微软创新之音

“刚加入微软的时候,就开始做语音、音频方面的处理,慢慢的我才能做到检测一些精细的特性。现在自动音乐标注准确率其实也只有60%左右,但用户还是比较能接受的。”而伴随着芦烈在微软亚洲研究院成长的轨迹,音乐导航技术也在随之完善。

“我们要更完善这些东西,希望能有更多的属性,比如现在大部分的属性都是针对欧美的一些流行音乐,对古典音乐现在还没有涉及,对中文或日韩音乐的一些专有属性也不能精确的表达。另外,因为我们是非专业的音乐人士,意味着我们标注的一些训练数据质量不一定很高,所以,我们希望跟一些公司合作,用他们专业人员标好的数据来训练模型,在这个的基础上把自动音乐分析做得更加准确、完整。”

音乐导航技术可以用在手持设备、音乐播放器里,还可以用在电脑上。不过,现在自动音乐分析的计算强度很高,芦烈和他的团队正在想怎么在保证精度的情况下提高速度、应用、完整性、准确性。

把技术成果放进微软产品里去是芦烈和同事们一直以来引以为傲的事情和希望,现在,微软的产品组非常喜欢“音乐导航”,芦烈正在跟不同的团队频繁沟通,也在对产品集成作一些测试。这个过程,就像把一个个创新的细胞植入到微软充满活力的未来。