首页 > 范文大全 > 正文

图片搜索的收纳柜

开篇:润墨网以专业的文秘视角,为您筛选了一篇图片搜索的收纳柜范文,如需获取更多写作素材,在线客服老师一对一协助。欢迎您的阅读与分享!

如何从一堆乱糟糟的图片搜索结果中理出头绪?聚类的图片搜索会带来不同的体验。

现在市场上的图片搜索引擎多少有点懒人衣橱的味道。当你用关键词搜索图片时,常常会因为关键词本身的简单或模糊,导致搜索结果杂乱无章。面对搜索引擎给出的几千条结果而不耐烦地翻下去的时候,你的心情肯定就像临出门前,要在一个不整齐的衣橱里翻找今天要穿的衣服一样糟糕。

有专业人士做过一项调查,对比搜索图片经验丰富和经验有限的两组人,结果发现了一个共同的规律:当他们进行图片搜索时,往往不会主动去改变关键词,而是在结果中不断后翻,直至找到满意的目标为止。不要怪他们懒惰,这种举动是因为,在搜索一幅图片时,很多人并不知道该怎样定义关键字,而列得太多又往往适得其反。

新的技术能够带来什么改变吗?来自微软亚洲研究院(HSRA)的一对搭档,推出了一个名为“IGroup”(Image Group)的图片搜索聚类方向的研究项目,已经可以很好地解决用户上述的烦恼。

喜欢K歌、热爱音乐的研究员景风,和穿着时尚、寓有亲和力的用户体验设计师王烁,绝对是MSRA里的两个个性分子,前者负责该项目的具体算法和技术实现,后者则从用户体验的角度设计整个交互流程与界面。他们的IGroup和他们本人一样,都有点突破传统思路、另辟蹊径的味道。目前,IGroup中的某些关键技术已申请了专利。

IGroup可以架构在某个基础搜索引擎之上。它把用户获得的搜索界面分为了两个区域,左侧是与关键字相关的短语聚类和小型缩略图,右侧则是图片搜索结果的展示区。这有点像是带有分类格子的衣橱,而所有的分类都是系统自动完成的。比如,当你搜索“Tiger”(老虎)一词时,左侧的聚类会显示出与之相关的几条短语,除了将其细分为“孟加拉虎”、“印度虎”、“西伯利亚虎”等类别外,还会出现类似“Tiger Woods”(“老虎”伍兹,一位著名的高尔夫运动员)的分类,甚至还有苹果曾经的代号为“老虎”的操作系统。用户可以先在左侧根据分类词条和小型缩略图进行初选,而后再在与之相关的右侧展示区中详细浏览。

在右侧的浏览区,初始结果有多种显示排列方式。其一是从左侧导航区的每个分类中抽取几幅具有代表性的图片而形成的聚类缩略图;其二是自动显示某一较大的图片聚类。

这种结合了语义的归纳视图能够显著提高图片搜索的效率,且能够带给用户额外的提示。比如,当你搜索“pentagon”(五角形)时,IGroup会在导航区列出美国五角大楼和五角形(pentagon shape)等不同聚类短语供用户选择,这样用户便可以在下一次的查询中,直接输入曾经点击过的某个词条作为关键字,由此获得更精准的搜索结果。

事实上,关于图片的搜索聚类并不是一个新鲜话题。传统的做法是,对每张图片抽取一个特征(文不的或者图像的),然后进行聚类。但这一方式显然在效率和速度上处于劣势。IGroup选择了个巧妙的做法,先根据用户的图片搜索关键字,再在搜索引擎中进行文本搜索,抽取出前几百个结果中反复出现的高频短语作为二次图片搜索的关键词(大约在20个以内),而对于一些无法分类的词则存放在一个名为“Other”(其他)的类别中,这样一来既覆盖了所有搜索结果,又在不影响速度的情况下提高了查询的效率。

在算法实现上,如何定义和获得准确的聚类,如何消除各类中的冗余图片等,都是IGroup研究的难点。景风和王烁也在尝试进一步优化这一项目。在未来,他们可能采取类似的机制,根据用户的搜索和点击情况,对聚类和缩略图进行排序;也可能会将目前的聚类分为多个层级,让用户可以有进一步细化的选择。

方式多种多样,但可以预见的结果是,未来的图片搜索将会变得越来越聪明、越来越方便。