首页 > 范文大全 > 正文

人机交流智能化

开篇:润墨网以专业的文秘视角,为您筛选了一篇人机交流智能化范文,如需获取更多写作素材,在线客服老师一对一协助。欢迎您的阅读与分享!

传统的人机交互,基本上通过键盘、鼠标、屏幕等方式进行,这些方式无法使计算机以类似人的智能来理解和适应人的情绪或心境,也很难期望人机交互自然和谐,使得冰冷的机器缺乏人性化的因素。因此,新一代的智能人机交互模式正在逐步形成。智能人机交互技术融合了人工智能、语音处理、计算机视觉、图形学、自然语言处理、多媒体技术等众多研究领域,同时它也是心理学、语言学、社会学等方向的研究分支,具有很强的交叉性和综合性。智能人机交互的应用,不但使数字产品更加易用、高效,还将使数字产品发挥出更庞大的潜力,越来越多地产生符合人性化的功能和应用。

以人为中心的交互

传统方式下,计算机通过多种设定的程序与人交互,需要人去主动适应计算机。在新的交互模式中,计算机则能根据人的动作来主动适应人的要求,例如通过分析语音来识别人发出的命令,并通过语音合成来表达信息。

如何让计算机“看”,属于计算机视觉研究的范畴,已开始应用于实际的身份认证技术,例如虹膜识别、人脸识别等技术,通过采集的图像来获得信息并得出结果。现有的技术可以通过摄像机拍摄人的面部表情,然后利用图像分析和识别技术进行表情识别。能把图像“看进去”早已不是问题,一个小小的摄像头就能胜任,关键是如何从图像中获取所需的信息。要让计算机像人一样的“看”,最根本的问题在于计算机对图像的最终分析和理解,尽管图片中的形状、颜色、纹理已经为计算机提供了较多的信息,但是要能用先验知识去思考、识别,就又回到了人工智能这个老问题。

2002 年伦敦帝国学院的科研小组花费数年时间来研究人类眼睛活动与大脑感知之间的关系,最终发明出一种专门用来捕捉眼球细微动作的红外线感应装置,被他们称为“眼标”。它能鉴别眼睛在显示屏上的移动和注视,如果电脑使用者盯住屏幕上的某个链接图标1秒以上,电脑就自动打开该链接;如果使用者盯住打印或者存盘的图标,电脑就会自动进行相应的操作(附图)

中科院自动化所研制成功的通过脸部动作来控制的智能轮椅,能够让使用者利用头部姿态控制其转动,即当人的头转向左边,轮椅左转;人的头转向右边,轮椅右转。这实际上是适时脸部跟踪和头位估计的问题。

随着传感器技术的发展,越来越精确的交互方式成为可能,例如用于识别手势的数据手套。它能对较为复杂的手的动作进行检测,包括手的位置和方向、手指弯曲度,并根据这些信息对手势进行分类。类似的,SimGraphics于1994年开发的虚拟演员系统,通过用户戴上的安装有触及脸不同部位的传感器的头盔,来控制计算机生成表情图像。

人机交互追求全方位

虽然语音、表情、姿态等均能独立表示一定的含义,并在某些场合完成交互过程,但人在交互过程中却总是通过各种信息的同时处理来进行的。实现多通道的人机界面是人与计算机最为自然的交互方式,它集自然语言、语音、手语、人脸、唇读、头势、体势等多通道为一体的,并对这些通道信息进行编码、压缩、集成和融合,集中处理包括图像、音频、视频、文本等多媒体信息。目前,多模态技术正在成为智能人机交互的研究热点。

“模糊”理解人的情感

精确交互技术能用一种技术来完全达到用户的交互目的,例如键盘和鼠标器均需用户精确输入。而人们的动作或思想往往并不很精确,计算机应该理解人的要求,甚至纠正人的错误,智能化的交互界面就是为了实现这样的目标。与此同时,新一代的人机交互过程能够处理复杂的情感信息,这就是所谓的情感计算。

人的情绪与心境状态的变化总是伴随着某些生理特征或行为特征的起伏,人们表达情感通过一系列的面部表情、肢体动作和语音来进行,又通过视觉、听觉、触觉来感知情感的变化。视觉察觉则主要通过面部表情、姿态来进行。语音、音乐则是主要的听觉途径。触觉模型则包括对、冲击、汗液分泌、心跳等的处理。

情感计算研究的重点就在于通过各种传感器获取由人的情感所引起的生理及行为特征信号,建立“情感模型”,从而创建一个能感知、识别和理解人类情感的能力,并能针对用户的情感做出智能、灵敏、友好反应的个人计算系统,缩短人机之间的距离,营造真正和谐的人机环境。目前为止,有关研究已经在人脸表情、姿态分析、语音的情感识别和表达方面获得了一定的进展。

无处不在的计算

由于新一代高速互联网的飞速发展,网络带宽和CPU 计算能力的成倍增长,以及多媒体技术的日益成熟,计算机、通信及多媒体技术逐步趋向融合。以互联网为基础的信息基础设施,将成为人与人之间交互或人与信息源、外部世界交互的媒介。在这种环境下,计算将无处不在。

无处不在的计算最早是由已故的Xerox Parc计算机科学实验室主任Mark Weiser 和他的研究小组在20 世纪90 年代初构想并提出的。Mark认为,从长远看,个人计算机和工作站会消失,因为计算会变得无处不在,这种消失并不是技术发展的直接后果,而是人类心理的作用。当人类对某些事物掌握得足够好的时候,这些事物就会成为生活中不可分割的一部分,人们就会慢慢地忽略其存在。今后,许多计算装置也会变得就像Don Norman描述的那样变成了不可见的计算机,计算也会变成无处不在,不可见的人机交互也会无处不在的。就像我们时刻呼吸着的氧气一样,我们看不见却可以体验到。

受到无处不在的计算以及穿戴式计算机和虚拟现实发展的影响,MIT Media Lab的H. Lshii等人对早期的GUI(Graspable UserInterface,可抓握用户界面)理论进行了重要发展,于1997 年提出有形用户界面的思想。传统的图形用户界面事实上成为隔离物质世界和信息世界之间的屏障,而有形用户界面希望在用户、比特和原子之间建立一个无缝交互界面。

信息内容的智能处理

人和计算机的交互一方面是为了获得服务,另一方面则需要通过计算机处理大量的信息。因此,智能人机交互的另一个重要范畴就是实现信息内容的智能处理。

信息技术产品逐步进入后PC时代,各式各样的信息家电、网络接入终端以及集成计算与通信功能的产品繁多。易用性、善解人意已逐渐变成信息设备参与市场竞争的关键。甚至一个具有重大创新的知识产权将带动一个新产业。如中文和汉语信息处理,面向信息内容的智能化处理技术,包括文字与语音的识别、翻译、查询、分类、摘要等。这方面的技术突破将极大地推动信息服务业和计算机产业。

将信息转变为知识、将信息基础设施发展为知识基础设施是21世纪的重要技术发展方向。其中,软件技术将在数据发掘、知识发现、Internet海量信息的智能化检索和网上软件机器人等方面进行重点突破。

传统与智能交互并存

新一代的智能人机交互,力图淡化传统的计算机数值计算的概念,突出以人为本的交互过程。那么传统的以键盘、鼠标和屏幕为基础的GUI 交互界面是否马上就会消失呢?

美国著名的计算机图形学家A.VanDam 认为:“虽然各种三维图形的应用发展得很快,如虚拟现实、科学计算可视化等,但GUI、3D Widget等都将长期存在”。这是因为目前大量的应用已经采用成熟的GUI 技术,因此GUI 不会被淘汰。

国内外研究状况

随着虚拟现实、科学计算可视化及多媒体技术的飞速发展,新的人机交互技术不断出现,更加自然的交互方式将逐渐为人们所重视。目前,国际上正在进行研究的有关人机交互技术的项目主要有:MIT媒体实验室的多通道自然对话项目,C M U 交互系统实验室(I S L ) 的INTERACT项目,欧洲信息技术研究战略规划(ESPRITII)的Amodeus 项目等等。这些项目中,语音、自然语言、手势、视线跟踪及头部跟踪等各种形式的输入技术正在研究中,沉浸式的头盔显示器已经开始使用,新的立体显示设备也正在研制。在GUI基础上,新的人机交互技术已逐渐开始应用。

中科院自动化研究所模式识别国家重点室正在投入巨资从美国引进了运动捕获系统、三维扫描仪等设备,并添置了相关的软件,正在积极地进行智能人机交互的研究,并通过各种平台向嵌入式终端、游戏平台、个性化网页服务等应用领域转化。 var _userid = '';var _siteid =2230;var _istoken = 1;var _model = 'Model03'; WebPageSpeed =281; UrchinTrack();