文档文库

手机版

投诉建议

首页 > 人机交互发展状况深度分析及前景预测分析汇总

人机交互发展状况深度分析及前景预测分析汇总

发布时间：2018-10-14 21:20:08 来源：文档文库

小中大

字号：

手机查看

人机交互发展状况深度分析及前景预测分析

一、人机交互概念

人机交互（Human-ComputerInteraction，HCI）主要是研究用户与系统之间的信息交换，它主要包括用户到系统和系统到用户的信息交换两部分。系统可以是各种各样的机器，也可以是智能电视机、智能手机以及计算机系统和软件。用户可以借助操纵杆、数据服装、眼动跟踪器、位置跟踪器、数据手套、压力笔等各类穿戴设备，用手势、声音、姿势或身体的动作、眼睛甚至脑电波等向系统传递信息，同时，系统通过各类机器、显示器、音箱等输出或显示设备给人提供信息。

理想状态下，人机交互将不再需要依赖机器语言，在没有键盘、鼠标以及触摸屏等中间设备的情况下，实现随时随地实现人机的自由交流。从而实现人们的物质世界和虚拟网络的最终融合。

从本质上，人机交互技术是一个典型的模式识别问题，智能机器通过多种传感器，获取人的表情、姿态、手势、语音、语调、血压、心率等各种数据，结合当时的环境、语境、情境等上下文信息，识别和理解用户的情感。这包括传感器技术、计算机科学、认知科学、人机工程学、多媒体技术和虚拟现实技术、心理学、哲学以及人类学等诸多学科领域有密切的联系。

二、人机交互发展阶段

从以设备为主到忽略设备存在，是人机交互的基本发展思路。交互建立初始，从按键到触控屏的转变是关键，重点是提高触控性能和扩大触控范围；同时显示质量从VGA至UHD（4K）；工业设计方面则是更纤薄的曲面显示。之后，专注于用户的个性化交互还是被广泛应用，变革的标志是密码的使用正在减少，取而代之的是生物识别（用户独有的特征）。这将推动移动支付的普及，但仍需要协调银行，支付机构，商家，技术提供商等各个环节，因此需要FIDO（线上快速身份验证）联盟来制定标准。接下来，专注于环境的情景识别交互是必然趋势，这个阶段的目标是让设备能够了解环境情况，能够预知用户的潜在需求。这需要不同类型的传感器一起工作，增强现实感。最终，个人设备将退居幕后，甚至消失在信息基础设施中，取而代之的是纤巧尺寸的传感器将无处不在。这是通过全方位感知来获得终极用户体验的阶段。

三、人机交互产业链

从人机交互过程来讲，可分为四步：通过传感器直接或间接与人接触获得感知信息；通过建立模型对感知信息进行分析与识别；对分析结果进行推理达到感性的理解；将理解结果通过合理的方式表达出来。也就完成了人机交互的全过程。

从功能实现看，人机交互作为一个闭环的模式识别系统，应该包括感知信号的获取、感知信息的分析与识别、感知信息的理解和信息表达等功能四个环节，当感知信息与标准信息存在差异时，将发出指令给予修正或反馈信息给予告警和提示。在这四个方面的环节中，感知信息的识别和感知信息的理解是核心技术的关键所在。

从技术实现过程看，信息获取和信息识别环节属于感知层的范畴，而感知信息的理解和信息表达属于应用层的内容。体感设备实现信息的获取，而嵌入芯片实现体感信号的模式识别，然后通过后台计算机或分布式计算平台建立数学模型、实现强大的运算系统，实现感知信息的理解（理解用户姿态或手势的真实目的），最后转入应用层，调用相关应用程序，满足用户的最终需求。

四、技术发展历程

人机交互的交互技术分类：（1）基本交互技术；（2）图形交互技术；（3）语音交互技术；（4）体感交互技术等。

图表　人机交互技术发展

资料来源：产研智库

五、技术发展热点

触控技术是目前最为成功的人机交互技术，可穿戴设备、物联网和车联网等概念的落地，可以让触控技术拥有更广泛的应用领域。这些设备都涉及到人对设备的控制以及人和设备之间的交互，这就给触控技术提供了很大的发挥空间。但是巨大且增长迅猛的市场只是一个方面，触控技术还面临着不小的挑战，这个市场的竞争非常激烈。另外，移动设备主要的增长潜力目前集中在中低端市场，这部分市场显然对成本更加敏感，因此触控技术公司也面临着较大的成本压力，我们的客户、合作伙伴会不断要求用更具性价比的方式来实施触控技术。从这个方面来讲，触控技术虽然取得巨大成功，但是人机交互新技术的研发也势在必行。

在人机交互技术方面，目前业界仍在进行多方面的探索和尝试，但生物识别技术和手势控制技术是目前最值得期待的技术。生物识别是以人的生命体征作为识别依据，包括指纹、虹膜、面部，乃至眼睛当中的血管，它们都有可能帮助智能终端设备验证用户本人的身份。当云服务被人们更加广泛地采用时，生物识别技术将帮助我们更方便和安全地登录到云端账号。在不久的将来，生物识别技术将使我们不需要再随身携带信用卡、钱包或者现金这些东西，所有的信息都将与我们自身的生命体征绑定。除此之外，结合高保真影像技术的使用，手势控制技术同样具有非常好的应用前景。

图表　人机交互产业链分析

资料来源：产研智库

六、人机交互改革

科技与需求双轮驱动下的人机交互三次革命。随着信息技术的高速发展，人机交互技术实现了三次重大革命，（1）鼠标；（2）多点触控；（3）体感技术。

鼠标：苹果设计的世界第一款大众普及鼠标“Lisa”，它在位置指示上比键盘更加人性化，是“自然人机交互”的始祖，随后鼠标逐步成为计算机的标配；

多点触控：苹果将多点触控推向大众。颠覆了传统的“交互模式”，带来全新的基于手势的交互体验。

体感技术：Kinect被誉为第三代人机交互的划时代产品。它利用即时动态捕捉、影响识别、麦克风输入、语音识别等功能，实现了不需要任何手持设备可进行人机交互的全新体验。

七、人机交互设备市场

人机交互设备市场规模增长前景广阔，2014年全球规模达千亿美金。2015年上半年，全球智能电视机总销量为4019万台，占全部电视机总销量（9792万台）的41%。可穿戴设备市场增长潜力巨大，未来五年内年均增长率有望达到35%，发货量将由2015年的年均3300万增涨至2019年的14800万。其中，智能手表的发货量将位列第一，2016-2020年内年均发货量增长率将有望达到41%。

八、指纹识别

在过去，指纹识别主要应用于打卡、门禁或银行金融服务，不过随着移动互联网的到来，包括信息安全、移动支付等应用大量需求生物识别认证，指纹识别逐渐成为各大手机厂商追捧的卖点和标配。

2013年，苹果的iphone5S加入指纹识别功能，开始推动指纹识别在手机行业的爆发。到了2014年，可以说成为国内指纹识别手机元年，包括华为、OPPO、魅族、小米等知名手机品牌都推出了指纹识别手机。其中魅族的MX4PRO、华为Mate7都取得了非常好的销售成绩。由于指纹识别不仅是安全入口，同时也是重要的身份识别入口，因此除了手机厂商，包括移动支付、智能家居、穿戴设备、互联网企业在内都在围绕指纹支付打造良性的生态圈。

近两年国内厂商在晶圆生产、封装、模组生产环节的投入力度比较大，也因此取得了很大的进步。目前这几个环节均已具备了大批量生产的能力。其中包括昆山凯尔、欧菲光、信利等过去生产触控、摄像头模组的封装厂也在加紧布局指纹封装，模组单价达到11~12美元。

在核心专利方面，目前拥有自主的指纹算法的国内芯片厂商还比较少，主要专利还集中在国外厂商手中。苹果在2012年收购了指纹传感器及解决方案提供商AuthenTec，目前主要应用到苹果自家的产品上。除了AuthenTec外，安卓阵营的指纹芯片厂商如挪威的IDEX、瑞典的FPC、SynapticsValidity、国内的迈瑞微、神盾等少数几家拥有自主的算法及核心专利，除此之外主要采用第三方的指纹识别算法。

目前第三方的指纹识别算法提供方包括杭州晟元、深圳指芯等。指纹识别的原理是对于生物核定特征进行技术提取，在这个过程中还要考虑到因为受到腐蚀而导致指纹变化的因素。往往每家的技术对于生物特征提取理解有一定的差异，这也导致不同价的技术无法实现兼容。由于行业并没有一个统一的标准，也没有统一的检测仪器来定义产品的合格标准。这跟现在的电容屏市场情形一样，一方面给了手机终端厂商很大的发挥余地，另一方面也加大了手机终端厂商前期产品的开发难度。

也有业内人士认为，指纹识别并不能完全保证身份信息的安全性，因此有必要和其它生物识别技术相配合，比如虹膜技术。

在指纹识别供应链日趋成熟的同时，缺乏相关应用也成为制约指纹识别产业发展的瓶颈。目前国内对于指纹识别技术最感兴趣的公司莫过于阿里。淘宝已在2014年支持了三星S5、Note4以及iphone6等三款支持指纹识别的机器，后续还增加了华为Mate7。

此外，阿里还与指纹算法提供商杭州晟元合作推出亿级指纹图像搜索库，并推出了多功能指纹支付终端。这个终端可以让支付宝的认证商户在线下方便安全的实现金融交易，同时还可实现商户积分管理。对于指纹识别来说，一切在刚刚开始。未来指纹识别若想普及到千家万户，还需要终端及系统厂商努力挖掘除移动支付之外的指纹应用。除了手机等移动终端，可穿戴物联网将是指纹识别下一个重点方向。

在2015年移动世界大会上，高通公布了Snapdragon Sense ID 3D指纹技术。与业界普遍的电容式传感器不同，高通采用的是超声波传感器。由于超声波可以穿透各种材料——包括玻璃、金属、以及蓝宝石，这意味着可以将传感器集成在触屏、手机外壳甚至智能手表中，该技术也有望实现更高的识别精度。不过也有业内人士对此技术持怀疑态度，认为这种方式不是提取真皮指纹模板，可破解方式太多，在安全方面存在漏洞。

九、智能语音交互

经过多年的发展，智能语音人机交互产业形成了从核心技术研发到知识库提供再到应用、服务的完善的产业链。

图表　智能语音人机交互产业链

资料来源：产研智库

未来，智能语音技术的发展将从“能听会说”的语音应用走向“能理解会思考”的人工智能方向。随着智能终端的广泛普及(+微信关注网络世界)，语音交互需求不断提升，语音技术和产品将由后装不断向前装发展，并逐渐向芯片集成方向过渡。同时智能语音将在更多垂直行业深入应用，推动垂直行业加快向智能化方向发展，智能家居将是下一个发力方向，有望为智能语音带来新的市场增长点。互联网创新和产业互联网发展不断加快，“互联网化”已从趋势成为常态。智能语音在互联网化过程中转型发展，其市场格局将被重塑。智能语音应用的不断深入和信息安全形势的日益严峻，使得语音信息安全的重要性日益凸显，并将成为政府和业界关注的焦点。

十、体感交互

在两个方面体感交互技术可以明显体现其优势，可以作为突破点。

项目展示，比如科技馆，展览厅，体验馆等等，需要有一定内容向用户展示，希望用户能有一定互动的场合。这种应用场景，不需要用户长时间操作，不会出现用户体力疲劳状况，而且新的交互方式可以给用户带来新奇的体验；

游戏，体感游戏能够极大的增强游戏的互动性，而且这也许是增强现实的一个入口。Kinect一直在这个方向发力，目前国内有几家厂商也加入了，甚至有了产品出现，比如速盟享动，绿动，运动加加等，但是体验下来，效果明显出现的层次差异，有的体验感很不错。体感交互技术，虽然已经积累酝酿了几年，但是总的来看，目前还是处于初期，要想完成革命性的使命，还需时日，需要找好切入点和突破口。

十一、虚拟现实

人机交互方式从最传统的打孔机演进到如今的触控屏，越来越拟人化，在半导体技术的帮助下，人机交互理念从“人适应计算机”进化到“计算机适应人”，人们要求通过视觉、听觉、触觉、嗅觉，以及形体、手势或口令，参与到信息处理的环境中去，从而取得身临其境的体验。因此虚拟现实（Virtual Reality）技术本质上说是一种高度逼真地模拟人在现实生活中视觉、听觉、动作（甚至包括嗅觉）等行为的人机交互技术；这种信息处理系统已不再是建立在单维的数字化空间上，而是建立在一个多维的信息空间中，虚拟现实技术就是支撑这个多维信息空间的关键技术。综合运用“虚物实化”和“实物虚化”，使得虚拟环境中既有计算机创造出来的虚拟实体，又有真实世界物景。

虚拟现实的概念在1965年由Ivan Sutherland发表《The Ultimate Display》论文提出，并与1966年在MIT林肯实验室研制出第一台头盔式显示器；1993年美国波音公司将其应用于波音777的开发，1996年英国投入了世界第一套虚拟现实环球网络。

十二、人机交互方式存在的不足

当然，目前来看这种场景还需要一些时间才能实现。但随着可穿戴设备、智能家居、物联网等领域在科技圈的大热以及落地，全面打造智能化的生活成为了接下来的聚焦点，而人机交互方式会逐渐成为实现这种生活的关键环节。

就目前而言，人机交互方式还存在着诸多的不足，主要有以下三方面：

（一）使用范围局限

在人机交互技术领域，尽管当前已经有许多新兴交互方式的尝试，比如体感交互、眼动跟踪、语音交互、生物识别等方式，但大部分的交互方式使用率都不是非常高，也还未进入真正意义上的商业应用普及中，更没有哪种人机交互方式，能够达到人可以毫无障碍、随心所欲地和设备（机器）交流的水平。

比如体感交互，目前还只能局限在游戏领域，与这种交互方式联系最紧密的一种智能设备就是虚拟现实设备。用户只需带上这款设备，利用手、脚等身体语言，就能身临其境地体验整个游戏的过程。尽管有了一定的程度的应用，但在娱乐领域的应用和进入生活领域的应用是不同层级的概念。在娱乐中出错，充其量是用户吐糟下，但在生活应用中一旦出错，直接影响的是生活，或许安全。很简单的例子，比如我们借助于体感交互实现电视机控制，我们的手挥动半天频道没切换，或者总是切换错误，这就不是吐糟的问题，而是直接被抛弃的问题。

还有一些交互方式则只在专业的领域内使用，比如动作捕捉交互方式更多地被用于电影制作领域，迪斯尼公司就是通过这种方式捕捉演员的动作以改进动画制作效果。包括眼球追踪，尽管谷歌眼镜做了应用的尝试，但目前更多的还是停留在一些专业的研究机构或者实验室的应用中。

对于不稳定的交互方式而言，显然在小众的专业领域内更容易被发挥，但这与未来全面实现智能化的生活目标是相悖的。

（二）仍未摆脱界面交互

虽然随着智能手机的铺天盖地而来，我们的双手终于可以稍稍从键盘上解放了，借助触屏省却原先繁琐的打字输入环节，但用户仍旧未彻底被解放，反而因为对触控交互智能设备的依赖变得越来越不自由，低头族顺势壮大了起来，成了这个时代随处可见的非常“靓丽”的一道风景线。

对于像触控这种交互方式而言，本质上还是与传统的鼠标输入、显示屏输出一样，只不过形式换了一下。用户仍旧需要有意识的地输入精准的需求，才能获得设备相应信息的反馈，而这对用户来说，还是太费神太累了。

另外对于整天带着一个手机或者iPad也是一件比较糟心的事，怕掉怕被偷，包小占地方，也重。

另外一方面则是，在信息大爆炸时代，我们今天缺的已经不是资讯，而是如何能简单的让我们获取有效的资讯。这其中，更为简单、直观、人性化的人机交互方式就成为了一个核心。

总而言之，哪天等你摆脱了这些iPhone6、7、8等任何看得见的智能设备后，还能毫无障碍得完成确认收货、新闻浏览、点赞等等动作时再来跟我说你解放了。

（三）信息识别困难

除了逐渐普及了的多点触控交互方式以外，其他大部分的人机交互方式在技术以及使用稳定性上还有待突围。对于用户来说，很难接受在使用所谓的智能产品，却要干着机械操作的活，还得面对经常出故障的尴尬局面，那样的智能设备可以说是连“傻强”都称不上。

比如被奉为下一阶段主流的人机交互方式——语音，还比较不能让人忍受。

苹果的Siri，微软的Cortana、谷歌安卓的GoogleNow等，普遍比较机械木讷，一点也引不起用户使用的欲望，大部分用户只会在相对无聊的时候以它们为娱乐的方式，而不会奢望它们会给出什么建设性或者符合自己口味的建议。当然，从技术层面而言，语音交互的排干扰与识别相对要复杂，但也是最直接的，尽管目前在技术层面还存在着一定的局限与缺陷。

显然，当我们谈起人机交互方式，必定离不开谈人工智能，因为在智能化的时代，这二者可谓是你中有我，我中有你的关系，可以说是属于同一范畴。特别是语音这种交互方式，对人工智能的要求相对就比较高了，因为他承担这人与设备之间的传输桥梁与纽带。而人的语言这么多元，情感又如此丰富，设备如果傻傻的还怎么快乐地玩。

换句话而言，设备需要和人一样聪明，不管怎样也不能笨得太离谱，现阶段不求它们能读懂我们的潜意识，但至少不会读错我们发出的口令。到现在，用户还是难以认真地对待智能设备通过自己有限的“智慧”告诉我们的事情，但换个角度来说，当哪天我们开始真正重视智能设备发出的任何信息时，就是它们开始被纳入生活重心之日。

十三、告别单一模式

多模态自然人机交互是下一代人机交互的发展趋势。融合视觉、听觉、触觉、嗅觉甚至味觉的多模态交互方式，其表达效率和表达的信息都优于单一的视觉或者听觉模式。

多模态自然人机交互主要分为3个模块，分别是信息多模态交互信息输入、多模态交互信息融合和处理、多模态交互信息反馈。其中，信息输入模块主要接收来自人的“视听触嗅味”五感信息，然后借助多模态信息融合和理解模块，形成“感”觉和认知，并根据专家知识库系统和检索技术形成对用户的信息反馈，构建出多模态自然人机交互系统。

从自然人机交互的未来趋势看，高度便利的多模态自然人机口语对话模式是最为自然和最理想人机交互方式。比如，利用中科院自动化所构建的一个多模态自然人机交互系统，用户可以自由地和两个设置有不同聊天主题的数字虚拟人交互，对话主题包括咖啡、天气、科普、娱乐等主题。这种新型的多通道融合的人机对话模式，是下一代新型人机界面操作模式的有效探索。

目前，尽管多模态自然人机对话已经获得了很大进展，但由于环境噪声、用户方言口音及光照变化遮挡情况下的影响，计算机对人类视听觉信息获取、理解还存在一定误差，加上目前计算机在自然语言理解方面还存在一定困难，这使得计算机在与人交互的时候，存在答非所问的情形。这类现象严重影响了人机交互的体验。其根本原因在于，计算机虽然计算能力越来越强，然而对人而言很简单的推理、联想和夸张，计算机却很困难。因此，让计算机具有“智能”或者让计算机具有“思维”能力，是计算机是否能与人自由交互的关键。

十四、人机交互前景

万物互联是人机交互领域前所未有的重大机遇。基于生物特征的识别技术、基于环境的情境识别技术，基于极致体验的全方面感知技术等，将在全球市场呈现强劲的需求趋势。

如今，每小时有300万个苹果应用被下载；微信上每分钟发送1000万条信息。但这还远远不够，万物互联时代智能设备将延展人类的感官和认知能力，甚至拥有听觉、视觉、触觉。基于此，全新使用场景将会应运而生，并重塑一切方式和关系，而排在首位的正是人与设备之间的连接关系和交互方式。

人机交互变革将是继个人计算机、互联网、云计算、大数据之后的第五次信息技术领域的重大技术革命。

本文来源：https://www.2haoxitong.net/k/doc/56001c6e366baf1ffc4ffe4733687e21ae45ff72.html