首页 > 范文大全 > 正文

搜索无所不在

开篇:润墨网以专业的文秘视角,为您筛选了一篇搜索无所不在范文,如需获取更多写作素材,在线客服老师一对一协助。欢迎您的阅读与分享!

互联网搜索引擎的飞速发展,使得搜索已经成为人们获取信息最为简单,直接和自然的方式。在一个小方框中,键入几个字,一按回车,海量的信息瞬间就呈现在眼前,搜索,就这么简单。

在互联网工具普及之前,专业人员查询信息要先了解查询信息对象的结构,在专业的系统中,输入特定的条件,才能得出结果。现在,这种复杂的门槛已经不复存在了。搜索成为与网页浏览、邮件并列的网上前三项被最常使用的服务。

互联网搜索在带给人们便利的同时,潜移默化地改变了用户的行为习惯,从而也给整个IT技术应用带来改变。人们越需要搜索,搜索就越需要提升。搜索只是打开了通往信息世界的大门,搜索继续发展还面临很多挑战。

继续发展搜索技术

由于海量信息规模的飞速增长,搜索把越来越庞杂的信息带到人们的面前。帮助人们真正从中析取自己所关注所需要的信息,是搜索服务本质的再次回归,也是搜索技术所面临的巨大挑战。为了筛选有效和准确的信息,需要在网络内容分析、元数据建立和使用方面加强相关应用。

正确理解内容

为了获取符合用户需求的信息,并以合适优先顺序提供给用户,需要对信息内容正确地理解。目前,即使在网页搜索的范畴,以现行的网页标记和链结分析的技术的局限性日益凸现。

特别是对待日益重要的搜索引擎优化(SEO)现象,不得不以一些非技术的极端手段来处理。据报道,Google已经将其排序算法中Page Rank分析的权重调整到20%以内,另80%将更加侧重内容本身分析。

笔者所在的TRS公司,一直致力于基于统计学和语义学研究成果研发文本内容分析技术并取得良好的应用效果。内容理解或者说自然语言理解是搜索技术发展的重要课题,而且,在搜索的另一端,内容理解技术应用也有助于改变目前关键字检索的单一形式,丰富辅助手段,提高检索有有效性。

建立标准元素据体系

另外,除内容分析外,对元数据―描述内容的标记将更受关注,使用越来越普遍。目前在数字图书馆领域,元数据标引是信息加工的重要环节,元数据信息也成为在信息检索和交换的重要依据。标引良好的元数据和分类体系能够提高信息搜索的准确性、有效性。

如果说早期第一代网站目录式的搜索引擎是对基于网站元数据和分类体系提供服务,那么将来对于网络上网页及文档形成元数据规范及网络化社群化的元数据标引维护机制,并基于这个体系提供服务,则会对于网络信息资源的定位,搜索,交换和挖掘,带来质的提升。

目前,在政府、新闻和某些行业,已经着手建立信息资源的元数据标准和目录资源体系。建立和发展基于统一和规范的元数据体系的增值搜索服务,可从另一层面将搜索结果向更准确更有价值的目标推进。

创新搜索服务

在搜索技术应用的突破以外,搜索服务的创新也是搜索继续发展的关键推动力。目前,主流搜索引擎服务仅仅局限在互联网搜索引擎方面,搜索WEB页面和文档,商务模式也以竞价排名等在线广告为主,目标对象主要是大众,这种单一服务具有很大的局限性。

不过,互联网搜索引擎服务的突出贡献,就是把搜索,作为一种信息获取的快捷方式,植入大众心中,并培养出人们的“搜索”的意识和行为习惯。

这种意识和习惯的影响,将转化为更广更深的搜索需求,使搜索会逐步扩展、渗透及深入到各个方面:在组织内部,有从网络到桌面、到企业内部乃至企业外部整个供应链上的搜索。

搜索的价值,可体现为高效率的信息共享所带来的更低运营成本、更多的商业机会或者更可控的经营风险;在外部,由面向行业或特定需求的细分搜索服务,满足以不同人群不同需求。可依托于差异化的搜索,发掘出搜索的价值,在广告营收之外,创新出付费搜索或信息交易中介的商务模式。

搜索下一步的发展,就是突破单一互联网搜索引擎的局限性,把搜索作为动词谓语,而不同的应用领域信息需求作为主语,二者相结合,创新出多维的细分的综合的搜索服务。

技术和市场四趋势

可以将搜索的技术和市场的发展,概括为四个方面的趋势。

智能化搜索

搜索的智能化,表现在三个方面:

第一,输入查询智能化,即以自然语言提问;

第二,输出结果智能化,在现有页面输出的结果之上,还能以分类、聚类、摘要等智能处理过的格式输出;

第三,检索导航智能化,比如肖邦的相关提示最好是莫扎特,而不是刘邦。

以上功能的实现依赖于面向内容分析的自然语言处理技术和知识挖掘技术的发展,而检索导航和结果输出的智能化方面,又依托于相关领域知识体系的建立,即前文提到的领域或行业的元数据和目录资源体系,只有掌握行业或领域的相关知识才能提供好智能服务,这给行业搜索引擎留下了优势空间。

个性化搜索

搜索个性化,搜索个性化强调的是 不同用户的相同请求返回不同的结果,力求搜索结果与用户兴趣相符。

它的实现依赖于“用户兴趣挖掘技术”,即根据用户的注册信息和历史搜索请求、点击情况挖掘出用户兴趣,并按照用户的兴趣将搜索条件进行修订,搜索结果根据兴趣权重进行重新排列组合,直接返回最有可能的结果。

“用户兴趣挖掘技术”实现数据内容和个人行为的联系和结合。比如:用户搜索“汽车”,根据他过去的点击情况,或许他更关注SUV而不是高档商务车,则关于SUV的文章就会排在前面。

而另外一个搜索用户的搜索结果可能大相径庭。在推荐相关搜索时,可引入其他具有同样搜索兴趣的用户的搜索词,也可从当前搜索结果主要部分文章中所提取出来的相关词。这样,即使没有非常完备的音乐历史人物知识体系的支撑,检索“肖邦”时,也很有可能推荐出“莫扎特”,而非“刘邦”。

在个性化这个角度提升用户体验需要一个长期努力过程,“用户兴趣挖掘技术”的实际应用在服务端需要大量的挖掘统计计算,且有些部分计算放到用户端进行可能更为有效,因此很有可能最终结合在桌面终端运行的程序来完整实现。因此,个性化搜索功能很有可能与发展中的桌面搜索终端相集成。

行业化搜索

搜索行业化,或者说搜索垂直化,注重某一行业或领域的垂直搜索引擎将取得很大发展。

研究咨询企业Jupiter研究公司报告认为,在行业成熟之前,搜索行业将在很大程度上重现媒体市场的发展道路,即从宽泛的搜索引擎分裂为致力于专门领域的各种垂直搜索。

在赛迪网一次关于搜索的调查中,有六成的网民认为面向某一领域的搜索引擎对其非常或比较重要。比如IT类从业人员最希望使用面向IT类的搜索引擎,金融证券从业人员希望有面向金融证券类的搜索引擎。

行业的垂直搜索引擎与行业数据库、行业知识、行业信息相关联的搜索,比Web搜索提供更多的专门信息和服务。它的后台数据一部分不在公众网上,搜索带有很多结构化数据检索的特征,同时又需要依托于行业元数据和目录体系。

垂直搜索引擎除了在线广告、付费搜索,信息中介的模式外,还可与电子商务相结合,打通搜索和购买的通路。在面向大众的领域,本地服务,招聘、房地产等有望成为垂直搜索的热点,而在各具体行业里,能够最大程度整合提供行业上下游供应链的资源,提供商务信息、供销意向乃至交易平台的搜索及综合服务商,有望成为该行业的“隐形冠军”。Alibaba和Yahoo的并购案,就表明了搜索引擎和电子商务结合的趋势。

部落化搜索

搜索部落化,指兴趣组数据共享。与面向大众的水平搜索和面向行业的垂直搜索引擎相比,这种部落化的搜索是相对小众的,但是其参与者的粘度和忠诚度都比较高。

他们既是信息的生产者、又是索取者和评判者,带有明显的“Web 2.0”的特征。博客搜索是一种部落搜索的门户,而在具体的兴趣部落共享数据中又有可能采用结合P2P技术的搜索,这种搜索概念和技术较新,还在萌芽和发展中,但从细分人群角度而言具有很好的商业价值。比如摄影爱好者的部落,就是摄影器材产品很好的营销渠道。

搜索新方向:桌面搜索、企业搜索

在互联网搜索风生水起的同时,桌面搜索和企业搜索也逐步进入人们的视野,成为搜索继续发展的方向之一。如果说互联网搜索是外部搜索,桌面搜索和企业搜索则是对内部信息的搜索。

企业搜索是解决组织中信息孤岛问题的一种有效的方式。企业搜索引擎一方面通过接口和企业内各信息系统相联结,有序地采集各信息系统中结构化数据,按预定好的规则组合和展示。另一方面,对企业中的邮件系统、文档系统、内部网站和论坛中的非结构化数据进行采集和索引,最终可以形成企业层面全面的信息整合共享,实现全面的企业信息监控和发现。

企业搜索必需解决好企业内信息访问的授权和存取控制,否则对于企业信息安全来说不啻为一场灾难。

桌面搜索在企业层面也可以和企业搜索很好的结合:桌面搜索成为企业搜索的子结点,把企业搜索从应用系统级别直接扩展到个人的桌面上;而企业搜索则是对各桌面的某种“联合”搜索。

在企业级网络中,个人和群组的资源访问权限可由企业目录服务来统一管理,桌面搜索和企业搜索的结果都根据用户所拥有的授权来限定,保障信息安全。

桌面系统支撑、用户权限使用、文件格式支持、应用接口开放等因素都将对桌面搜索和企业搜索的各种功能的丰富发展产生影响。从这个角度看,拥有桌面操作系统绝对份额的微软在桌面搜索领域将占有先天优势,Google等必须借助其他方面建立起来的强势来竞争。

搜索影响未来

传统信息系统的拥抱搜索是大势所趋。目前各种应用信息系统相对搜索引擎而言,还是一个一个的封闭的黑盒子和孤岛,搜索引擎只能是相对被动采集和处理这些系统的输出结果,而且只能处理相对开放的一部分(如网页、各类文档等)。

随着搜索成为人们获取信息的行为习惯,传统信息系统将拥抱搜索,获取更好的应用价值。比如:ERP、CRM等管理信息系统对企业的日常业务流程进行控制并采集数据,传统方式下,若要查询一些状态或统计数据,需要进入专业系统,在设定好的交互界面中操作,按系统设定的形式输出。

而企业搜索的方式下,通过搜索接口检索相关数据,虽然也必须依赖一些预定的数据提取规则,但数据访问已经突破了原系统的框框,可更加方便共享和使用。

例如:作为手机厂商,当你搜索到一篇手机市场最新消费趋势调查的文章时,同时可以即时察看自己同类各型号手机销量、库存以及新款手机的设计和开发计划进展,而不必在各个系统间登录和查找,这种集成了传统信息系统的企业搜索可给用户带来极大的方便,给予了用户在未预定模式和非精确条件的场景下,即时发现信息和获得知识的能力,利于规避风险和促进创新。

在技术上,今后的各种应用将更加“搜索友好”,比如主动地开放文件(数据)格式或提供搜索访问接口,以利于自身资源被整合到搜索服务中去,同时也会出现基于搜索结果之上的各种增值应用。

在搜索巨头的推动下,面向搜索的数据交换和应用服务标准有可能会出现,在其上形成搜索应用服务产业链。

或许,在不远的将来,搜索将不仅仅存在于互联网上,桌面PC上,还会进入我们日常的业务工作系统,进入社会各类公共服务平台,进入我们的手机,电视机顶盒……搜索成为一种工作生活方式―搜索无处不在。