分享

人机智能交互:从单一精确交互到多通道交互演进

 叨叨道 2019-12-03

人机智能交互是主要指机器和人类高效交流的技术。人类生活中的事件都是多通道的。人机交互的本质,是共在,即“being together”。人把自己的优点,和机器的长处结合在一起,形成了一个交互的、实质性的问题,而未来人工智能的发展方向,很可能是人机融合智能或人机混合智能,即把人的智慧和机器的智能结合在一起,形成一个更有力的,支撑性的发展趋势,这样不但研究人机交互的脖子以下的,即生理的问题,而且还会研究脖子以上的,即心理的或者大脑的问题。其实,人机交互或人机混合智能,都是不准确的词,最准确的词是人机环境交互系统,因为人和机器及物质,其交互是不完整的,是通过环境这个大系统来进行沟通,所以人机环境系统工程将是未来的重要研究方向。人类和机器多通道交互技术的发展虽然受到软件和硬件的限制,但至少要满足两个条件:其一,多通道整合,不同通道的结合对用户的体验是十分重要的;其二,在交互中容许用户产生含糊和不精确的输入。

一、单一精确交互方式

l  触控(Touch)

人类在20世纪70年代初,开始探索用触摸屏进行人机交互,出现在一些工业和商业设备中,例如POS终端机、电梯按钮等。之后诺基亚把电阻屏导入到手机上,部分的代替了机械键盘的作用。直至2007年iphone手机的推出,开辟了触控技术移动终端人际交互操作的新模式,成为触控行业发展的一个里程碑,苹果将电容式触控技术推向了主流,如今人们依然广泛使用。而后电容、红外、电阻、光学、纳米网格、弹性波等技术也相继推出。

l  语音(Voice)

语音交互技术是近几年来最受关注的技术领域,也诞生了一系列公司,例如科大讯飞、思必驰等等。语音交互技术主要以语音识别为基础,包括了语音听写、语音转写、语音唤醒、声纹识别。此外,语音交互还需要自然语言处理技术和语音合成技术来完成人机交互的闭环。目前自然语音处理技术,特别是语义识别技术仍然处于发展早期,未来存在很大的发展空间。

l  姿势(Gesture)

姿势交互技术主要利用数据手套、数据服装等装置,对手和身体的运动进行跟踪,完成自然的人机交互。例如谷歌的一项新专利通过手势控制智能汽车,挥手便可开关车窗。主要原理是固定在车顶的深度摄像头和激光扫描仪探测用户做出的手势,并通过手势传达给汽车智能系统,实现收音机、车窗等开关和调节。

l  视觉跟踪(Eye-Tracking)

视觉追踪是对眼睛运动过程进行定位的交互方式。例如瑞典Tobii眼动仪用于记录人在处理视觉信息时的眼动轨迹特征。现代眼动仪的结构一般包括四个系统,即光学系统,瞳孔中心坐标提取系统,视景与瞳孔坐标迭加系统和图像与数据的记录分析系统。未来的应用场景比较广泛,比如视线离开时暂停视频播放、帮助残障人士用眼睛打字写作等等。但复杂的应用如大型游戏的操控还存在较大的难度。

……

二、多通道交互体系

多通道交互的体系首先要能保证对多种非精确的交互通道进行综合,使多通道交互存在于一个统一的用户界面之中,同时,还要保证这种通道的综合在交互过程中的任何时候都能进行。人机交互技术是目前用户界面研究中发展得最快的领域之一,对此,各国都十分重视。美国在国家关键技术中,将人机界面列为信息技术中与软件和计算机并列的六项关键技术之一,并称其为'对计算机工业有着突出的重要性,对其它工业也是很重要的'。在美国国防关键技术中,人机界面不仅是软件技术中的重要内容之一,而且是与计算机和软件技术并列的11项关键技术之一。欧共体的欧洲信息技术研究与发展战略计划(ESPRIT)还专门设立了用户界面技术项 目,其中包括多通道人机交互界面(MultiModalInterface for Man-MachineInterface)。保持在这一领域中的领先,对整个智能计算机系统是至关重要的。我们可以以发展新的人机界面交互技术为基础,带动和引导相关的软硬件技术的发展,使更有效地使用计算机的计算处理能力成为可能。

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多