首页 > 范文大全 > 正文

多语言信息检索系统可视化初探

开篇:润墨网以专业的文秘视角,为您筛选了一篇多语言信息检索系统可视化初探范文,如需获取更多写作素材,在线客服老师一对一协助。欢迎您的阅读与分享!

[摘要]多语言检索的研究在信息种类越来越多的现在十分重要,除检索技术与翻译功能的研究外,信息可视化的运用以及界面设计是另一个研究要点。依据以前的研究和文章综述,信息可视化被证明是帮助用户实施多语言信息检索的有效方法。研究提出一个多语言信息检索系统可视化模型及其设计方案,并指出该领域未来的发展方向。

[关键词]多语言信息检索 信息可视化 界面设计

[分类号]G354.4

1 引言

在网络上收集不同语言的资料会面临一些困难:在检索不同语言资料时若将不同语言的检索结果混合排列,很容易互相覆盖检索结果或造成混乱。多语言检索的理想界面设计要能整合多语言检索结果,并注重多语言检索用户的满意度。如果尝试在搜索引擎上查询不同语言的信息,用户常用的方法是在各语言的检索界面中分别输入不同语言的关键词,在得到不同语言的检索结果之后再自行整理与分类。这样的步骤既复杂又没有效率,研究者设计新的检索界面要能针对用户需求,设法解决目前使用上的不便。目前已经有许多关于整合检索信息、信息可视化系统以及不同语言检索界面设计的研究,但是将多语言检索与信息可视化概念相结合在搜索引擎的研究上还比较少见。多语言检索是在网上搜索多种不同语言的资料,而信息可视化系统的运用能帮助用户分析资料并藉由和系统的互动得到更精确的检索结果。若能将两者结合并应用于检索系统界面的设计上,不但有助于让用户得到来自更多方面的信息,也能够运用图像帮助让检索结果更易于了解。本文的研究目的主要是依据用户的需要将多语言检索和检索可视化相结合,运用可视化技巧协助多语言检索的进行,并系统化地显示检索结果,让用户能够更有效率地得到需要的资料。

2 多语言信息可视化研究综述

本文首先将与多语言检索系统界面设计或可视化相关的研究文章进行整理。Chung讨论多语言检索的盛行对于系统设计以及用户行为的影响,文中检视现存的中文,西班牙文及阿拉伯文搜索引擎,并依据各搜索引擎的特色、功能与设计做整理与比较。他的研究利用实验测试了各双语检索网站与用户需要的检索界面并做可用性比较,透过用户测试发现网站设计理论是成立的。这篇文章中发表的网站设计概念包括了检索页、结果页以及分类、摘要还有可视化的功能。研究者在这篇文章中多次提及多语言界面设计必须要符合用户的使用习惯,也建议未来的研究能够将信息可视化与检索界面相结合。儿童数字图书馆(ICDL)是一个多国家多语言界面设计的范例,ICDL在设计界面时不做国际化或是地方化的设计,而主要依据网页的呈现和功能需求。这个研究所带来的启发是:图形的运用能够增加用户对系统的了解,并且无论对于不同年纪或是不同国籍的用户都有帮助。虽然本研究的系统用户族群和ICDL并非完全相同,但同样是提供不同语言用户的界面设计,因此可以从他们的研究中获得一点心得。

Zhang and Lin在发表的文章中做了三个搜索引擎的评鉴,并且列出了5个评鉴多语言检索系统的标准:搜索引擎的检索语言数目、多语言支援功能、翻译能力、协助功能和界面设计。他们设计出一套测试方式来检验搜索引擎的多语言服务,并做进一步的分析和比较,从而找出不同搜索引擎的优缺点。这个研究显示,大部分的搜索引擎还没有提供检索翻译功能,然而对于一个成功的多语言搜索引擎最重要的两个要点就是提供检索的语言数目以及翻译质量。Chau以及其他学者讨论了非英语搜索引擎的使用,并将研究测试结果与英语搜索引擎相比较,发现:有50%的检索只使用一个关键词,有90%的检索使用小于七个的关键词;因为字词的组成方式不同,每个检索词的字数会比英文检索还要多;中文检索中最常用的运算子是逻辑与“+”。此外,他们也讨论了中文检索的字元使用以及运算子运用议题。这个研究结果提醒其他研究者,不同语言的区域对用户的网络检索行为会产生影响,而信息可视化或许是一种可以用来消除语言隔阂的方法:在不同语言的检索界面上可以利用图标和颜色来帮助用户熟悉界面,再融入依照不同语言用户习惯设计的可视化技术如分类、阶层以及群聚。多语言检索能够藉由翻译功能来帮助用户查询。何大庆和吴丹使用相关反馈(relevanee feedback)来辅助多语言信息获取时的翻译,这种方式不但能帮助系统在翻译中摘录相关文件并且也能将这种方法应用在查询的翻译上。实验证明这是一种有效的方法,而翻译技术的发展也有助于使多语言检索系统在使用上更加便利与实用。

多语言检索也能藉由用户友好的界面设计来满足用户需要,Petrelli设计了一个以用户为中心的多语言信息检索系统(cross-lingual information retrieval sys-ten)模型,并要求用户对模型提出更改建议,然后根据用户的建议将检索系统重新设计一次。通过这样的使用测试他发现用户的一些偏好,包括:①虽然显示翻译过程可以让用户更容易修改查询词,但是他们还是比较希望能直接看到检索结果;②不同文化背景的用户会用不同的检索词,对结果也有不一样的期待;③对语言的了解可以增进检索结果的精确度。这个系统在设计时与用户互动,透过结果可知道了解用户需求对系统设计者来说是很重要的,而且除了文化背景、语言程度及用户的其他特性之外,界面设计也能影响系统的好用与否。Petrelli的研究突显出了解用户意见的重要性,在没计系统界面的同时也必须收集用户资料、了解用户习惯,并且在设计用户界面时考虑这些信息,此外,其他研究者整理出的用户需求也能作为系统设计的参考。下面总结以上几种多语言搜索研究的成果,如表1所示:

3 多语言信息检索系统可视化设计

本研究的系统设计结合信息可视化和多语言检索。研究之中所运用的理论包括信息可视化概念以及满足不同语言检索界面的设计需求。本研究的目标包括:信息可视化;设计合适的用户交互界面;支持双语的呈现。

信息可视化是一种结合图形、动态图像以及用户交互系统的信息表达方式,也是一种将对专业知识的了解与人类对电脑图像的认知结合的科技。所以在展示数量较多或是较为复杂的资料时,可以用信息可视化技术来协助用户了解信息。Shneiderman把信息可视化的资料形态分类成一维、二维、三维、时间、多面向、树状以及网络资料;并将信息可视化的功能分类为概观、放大缩小、过滤、随选详细资料、相关、历史资料、萃取信息。在检索可视化上比较常用的功能包括树状以及网络状的资料呈现,并搭配概观、放大缩小以及随选详细资料这些功能来与用户互动。信息可视化不仅能够运用图像将资料用合适的方式呈现,更可以将功能与资料呈现整合。许多搜索引擎都提供多语言检索功能,但是现有搜索引擎执行多语言检索时常常发生以下几种问题:多个语言的检索结果可能因为条

列式的排序方式而分散在大量的检索结果之中,或是因为不同语言检索结果交互出现而产生混乱。以谷歌检索为例,就算在语言偏好处设定检索结果的语言,和检索词相同语言的检索结果还是会自动排序在靠前位置。如果将语言也当做检索结果排序或呈现的一种选项,应该能更符合用户的需求。此外,对于不同语言的支持也是影响检索结果的另一个重点。

本文的研究将检索界面的设计加入信息可视化技术,让检索结果能够更有组织地呈现出来,也更能够满足多语言检索的需要。而要达到这个目标需要满足下面三个要点:①在界面设计上必须同时满足多种语言的使用习惯,并且考虑到多种语言不同的使用特性。例如英文是一个词一个词分开,中文却是每个字都有自己的意思,而且中文字的构造比英文相对复杂,如果字型太小会难以辨识。②要提供翻译或是语言选项来支援多语言服务,让用户可以选择查询词的语言和检索结果的语言。③将检索与合适的信息可视化系统结合,但要考虑到使用的便利性,不要过于复杂。此外,系统的信息检索与分类功能也是很重要的一环。要完成这样的研究必须将检索引擎的多语言检索结果使用图形化展示,让用户能够自行调整检索结果,并且使简洁的界面产生最大的功能。此外,未来也可在这样的系统里结合翻译以及检索优化的功能。

4 多语言信息检索系统可视化界面原型

综合以前学者所做的研究分析,并且依据多语言检索和信息可视化的概念,多语言检索要具备多语言使用的翻译与协助功能,并结合图像与资料,本文设计了一个多语言检索可视化界面见图1。

这个设计是以容易理解与使用便利性为优先考量的界面,且拥有以下的特点:①将不同语言的检索结果呈现在同一个界面上;②能将检索范围依据检索结果延伸或是缩小;③将检索结果做简易的整理;④引导用户做进阶检索。

4.1 将不同语言的检索结果呈现在同一个界面上

本界面尝试把中文和英文的检索结果同时显示,因此用户可以同时得到中英检索结果,将中英文的检索结果互相比较,并依序浏览或是从中选择最适合的信息,节省了重复检索的时间。

4.2 能将检索范围依据检索结果延伸或是缩小

将检索结果以信息可视化方式呈现也能将检索结果延伸,并且在显示关联性的同时提供用户可能需要的关键字,这种功能不但能协助用户探索更大范围中英文的相关资料,也能让用户将检索范围集中并提高检索结果的相关性。

4.3 将检索结果做简易的整理

多语言检索的结果资料笔数会更多,种类也会更繁杂,因此界面的简洁与容易了解是很重要的。本界面设计不仅能清楚地列出中文和英文的检索结果,也将检索结果做了概略的分类,增加用户浏览时的效率。

4.4 引导用户做进阶检索

在界面上可以看到关键字的翻译,例如输入检索词“春天”时也会同时显示英语翻译(spring)的检索结果,因此用户能够把关键字修正得更符合他们的想法。例如用户其实想知道关于春天酒店或是春天旅游的资料,也可以藉由可视化显示看到各个检索结果之间的关联性,用户可以借此让检索更符合他们的需求。

在使用上首先输入英文或是中文关键词,另一个语文也会自动进行关键词搜寻,并以图像表现各个主题词之间的关系,如果滑鼠按下与搜寻有关系的关键词,便能将相关的搜寻结果展开。这个界面延续了其他多语言界面的特性,然而清爽的界面让使用者更容易使用,图像也能辅助使用者使用双语思考,是其他双语系统所没有的设计。

5 未来发展方向

本研究为用户设计了一个可以简易整理与探索多语言检索结果的界面,也提供用户更多可以自行更改的选项。在将来的检索系统界面以及信息可视化设计中,研究者还可以将此系统界面设计朝以下几个方向发展:①将双语可视化技巧应用于不同检索结果中;②与翻译或是摘要功能相结合;③依据用户研究结果改进设计等。

5.1 将双语可视化技巧应用于不同检索结果中

目前只将同一个检索系统中的中英文检索结果在同一个界面整合,并且使用信息可视化技巧呈现。这种做法不但可以帮助用户整合检索结果,也便于比较和深入了解检索结果。未来更先进的系统设计可以提供更多的语言选项,也能与更多检索系统合作,让用户能自订检索引擎,将多语言检索界面应用到符合他们需求的检索结果之中。如此,不但可以扩大多语言检索界面的应用范围,让检索结果更符合用户需求,也让此设计的使用更具灵活性。

5.2 与翻译或是摘要功能结合

将多语言检索结果展示在同一个界面上之后,用户能借此机会对比双语检索结果并修正关键字,不过对于非母语的多语言检索不只需要展示和简易的分类功能,更需要翻译和语言方面的协助。此外,翻译功能也能协助用户了解不同语言的网页内容,进而将检索范围做适当的延伸或缩小。多语言检索在信息爆炸的现在是一种趋势,然而用户对于其他语言的了解可能无法满足他们对于多语言信息的需求。因此翻译或是简易的摘要功能都会有所帮助。

5.3 依据用户研究结果改进设计

未来将检索系统与研究者设计的创新检索界面连结之后,能实施更进一步的用户研究,搜集用户对于此界面的意见并且对用户进行深入访谈。虽然目前的界面主要是依据用户需求设计,并将可用性做为一项重要的设计原则,但是界面正式使用前还是需要经过用户测试,并依据用户提供的意见来调整设计以符合用户的需要。虽然界面设计不是一个困难的任务,但其对系统使用时的感受以及系统功能的发挥有决定性的影响,因此研究者们应该把系统界面设计以及用户和系统界面的互动当作一个重要的研究课题。将信息可视化概念融入界面设计中,在研发系统的同时也将界面设计以及用户测试列入系统设计的计划当中,这样有助于以用户为中心的系统设计以及发展,也能让网络系统设计更贴近用户的实际需求,进而达到用户对于多语言检索的需求。