GARTNER:2018年人机交互技术成熟度曲线
多模态接口以及机器学习和其他形式的人工智能技术的进步正在深刻地影响着人机交互。市场和商业模式创新同样影响着人机交互,新的、规模巨大且有利可图的相邻市场正在开放,特别是在汽车和医疗领域,有了新的增长和扩展机会。
一
2018年,三个技术已经从曲线上消失,因为它们已经被主流采纳。
➧ 1、人体增强技术现在已经转变为外骨骼应用,这项技术的大部分已经被市场采纳。
➧ 2、随着传统设备开始创建环境氛围,环境体验已经被抛弃。
➧ 3、环境显示出于同样的原因而被删除。
二
(一)上升阶段
1 嵌入式眼跟踪平台
嵌入式眼跟踪平台子系统是支持前端应用程序的“后端”平台,凝视控制就是其中之一。这些平台使应用程序开发人员和设备供应商能够缩短开发时间,降低未来汽车、AR/VR、消费者行为分析和医疗解决方案的成本。
嵌入式眼跟踪子系统的出现导致了潜在的商业化。现在,在较小的市场范围,TDPS开发了基于硬件参考设计的软件解决方案,开辟了一套新的、新兴的市场邻接,以前昂贵的研究和开发成本已经在这些设计中被摊销。虽然跟踪技术的基本原理到目前为止已经相对成熟,但作为一个平台的眼睛跟踪的应用仍然是新兴的。它的好处不像大众产品那样具有破坏性,但是在像病人辅助设备这样的垂直设备上,它的影响可能是巨大的。
业界要警惕新的竞争,因为进入壁垒较低。英特尔上下文感知工具包是开源平台的一个主要例子,它将吸引新的应用程序。Tobii为各种应用程序提供了四套开发人员工具包:UWP、CORE、Stream和Unityity。据报道,谷歌正在更新其下一个操作系统,包括对虹膜扫描仪的支持,这可能会迅速启动新的生物识别认证解决方案。巧合的是,今年早些时候,谷歌公布了一项发育性血压测试的结果,使用的是他们的神经网络测量的视网膜扫描。类似的系统自2016年以来一直在试验中,比如诊断糖尿病视网膜病变。汽车领域已经在使用自定义的系统(例如查看机器的眼睛跟踪器),现在可以在安全和信息娱乐应用中使用眼跟踪平台技术。身临其境的VR头盔(HMD)制造商已经实现眼睛跟踪,让用户(例如,游戏玩家)获得更好的娱乐体验。消费者行为分析当前正在融合人工智能和机器学习算法,采用眼跟踪作为输入技术。价格将是医疗方面应用的主要因素,未来先进的眼睛跟踪解决方案普通人也能负担起。
2 外骨骼
外骨骼是一种可穿戴的设备,由执行器驱动,可穿戴在全身,或上端或下端。它使用传感器和机械或液压系统来辅助、启用或增强人体的运动,如行走、举重和可重复的工作任务。外骨骼产品是高度定制的特定产品,与操作环境密切相关,大规模商业市场或军事市场采用还需要10年的时间。
由于外骨骼是会磨损的,设备的尺寸和佩戴者的尺寸要相匹配,保持可调整或基于织物的系统,提供一种适合大多数大众市场的外骨骼,还需要数年的时间。机器人技术和电池技术的快速发展将推动外骨骼技术的普及,特别是对制造业、军事、建筑业、医疗保健和仓储行业。当前,成本和电池寿命是更广泛采用的两个限制因素。3D打印的进展有望降低作为人体修复体的设备的单位成本。
物流和仓库管理人员应该更加关心外骨骼技术的使用情况,以提高工人的安全性或工作效能,包括极端重复的运动、可能产生健康问题的岗位等。用于提供工业解决方案的外骨骼将增强工人的力量和耐力。航空臂、背心或全套式外骨骼可用于重型或架空载荷或高频和长时间抬升等任务,让艰巨的任务变得容易,节省时间,提高成果质量,提高经济效益。
军事设备的采用估计很难证实,但外骨骼的使用很可能会跟随机器人和无人机的使用而兴起,因为这三者都与高科技战场、医疗后援和军事后勤作业环境的趋势密切相关。外骨骼在医疗应用中的应用范围很广,从减少永久移动能力丧失的假肢到用于临时损伤康复的可穿戴训练设备,使用肌电图(EMG)控制机制并建立在3D打印机上的现代假肢可能是近期最大的商业影响领域。这种类型的假肢可以将成本从20000美元降低到200美元。
3 步态识别
步态识别利用摄像机、地板传感器或脚踏传感器来识别和评估运动。作为一种分析工具,步态识别因其在健身、医疗、安全和生物鉴别等领域的非侵入性而受到重视。智能手机和可穿戴电子产品上使用传感器提供数据,使步态分析能够超越实验室设置在正常的生活环境。那些寻求推广“高科技”品牌形象的服装和运动服供应商将炒作步态分析的有效性。但是最近,阿迪达斯退出了可穿戴设备市场。
在可穿戴设备或智能手机上使用加速度计进行步态分析,有可能通过一个人走路的特有方式来帮助验证用户的身份。当然还有多种其他认证技术,如指纹匹配、人脸识别和声纹匹配,这些技术已经具有市场影响力。教练、运动教练、理疗师和个人训练师可以使用步态分析来优化运动员的步幅,并修改脚撞击地面的方式以减少伤害。零售商店内步态分析设备,通常使用相机,可以吸引顾客重复购买运动鞋和特种鞋。
安全专业人员应考虑步态识别如何改进监视系统,作为对面部识别的补充,以便更准确地识别可疑人员。在这些领域的研究将加速开发用于安全应用的更有用的系统。医疗机构的领导者应与医务人员合作,评估正在开发中的步态分析技术。系统已经过测试,以检测帕金森氏症和中风的早期阶段。与视觉相机系统相比,可穿戴传感器将降低步态分析的成本,并促进在健身和医疗保健方面的应用。注意下一代智能服装和智能鞋类,以进一步降低成本。
步态识别可以通过将其检测到的模式与被认为可疑或可能表明某人生病或受伤的运动轮廓库相匹配来改进监视系统,从而发出求助信号。步态分析在与其他识别技术一起使用时,可以帮助用户进行身份验证,并且可能成为一种准确的技术,能够识别一个人进行访问或付费。根据目前的市场情况,基于视觉的系统有一个比使用时间更早的时间框架。在家中使用摄像机的基于视觉的系统使用步态分析可以帮助识别家庭成员,这对于家庭安全监控或其他连接的家庭服务,可能是有用的。
4 体三维显示
体显示器以360度的球形视角创造物体的三维视觉表现,图像随观看者的运动而变化。与大多数通过立体或自动立体技术产生深度错觉的三维平面显示器不同,体显示器在三维空间中产生逼真的图像。
体显示标志性图像通常被认为是第一部星球大战电影中R2-D2创造的莱娅公主。当今体显示仍然是一个难以捉摸的,但却是令人向往的目标。
体显示分为两类:扫描体和静态体。扫描体利用人类视觉的持久性来重建快速投影的2d“切片”的体积图像。在预算不是很大的专业领域之外,除了少数例外,这项技术仍然在实验室而不是商业应用中。目前的技术限制了可以显示的体积空间的大小,而机械解决方案产生了潜在的危险和快速移动的部件。有兴趣尝试体积显示器的企业应该调研kino-mo,一种被用作零售标志或广告展示的大容量设备。全息显示市场的一家新进入者在2016年宣布了一种基于桌面的体积显示设备,该设备将交付给开发商。其他设备,如全息放大器,甚至简单的镜子,如2012年Coachella的Tupac Shakur表演艺术展览中使用的镜子,与扫描或静态音量显示器配合,可以提供高质量的体显示体验。
5 空间计算
面向企业协作的空间计算是一种将身临其境的大显示器和手势控制结合起来的平台,与虚拟现实(VR)/增强现实(AR)不同,空间计算系统是物理沉浸式的,通常安装在一个大型会议室中,包括多个大屏幕显示器、视频会议(连接远程协作者)和个人设备。
两个方面原因佐证了今年在炒作周期上空间计算的进步:第一,三维像素计算在汽车领域随着汽车发展成为个人空间的延伸,越来越多地拥有各种形状和大小的屏幕。第二,业务模式扩展到平台产品,允许第三方开发特定领域的解决方案。在空间计算的企业应用程序中,业务已经从昂贵的定制安装转向基于平台的使用案例。大型表面计算机和手势控制的成熟,再加上显示成本的降低,将推动主流的进一步采用。在虚拟现实(VR)和自动化(AR)的推动下,人机交互方面的创新意味着进一步的增强。但是,在软件和硬件提供商、开发人员和系统集成商组成的生态系统存在之前,空间计算仍将是一种雏形技术。
商业安装仅限于高端的客户体验中心和视觉协作系统,实现洞穴自动虚拟环境(如Visbox等)的供应商也创建了沉浸式的VR场景。虽然微软的IllumiRoom概念证明也是这样做的,但它使用投影来增强视觉场景,主要用于消费者和游戏应用程序。因此,它试图提供类似的、沉浸式的体验,但呈现的基本概念却根本不同。
将员工和其他利益相关者聚集在一起参加会议、协作和互动的专业组织的最终用户可以通过使用空间计算的物理环境来提供新的体验和提高生产力。现场和远程代理以电子形式(电子表格、文本文件和图形)交互,并将它们的输入(电子表格、文本文件和图形)贡献到共享环境中,使每个成员能够实时编辑彼此的输出。沉浸式字符协作比应用程序(如webEx或sky)中的单屏幕共享更具包容性。
营销体验将受益于这种新的方式,在沉浸式的三维环境中吸引和留住客户,而不需要小工具和头戴显示器。通过这种方式为社交媒体和社会互动提供了新的机会,将多个代理的互动与文字、手势和视频结合起来,为社交网络提供了将这种“粘性”,给用户创造货币化体验的机会。
6 电振动
电振动是一种基于触觉技术的触觉技术,其中皮肤中的触觉感受器可以感知纹理。电荷模拟局部振动和摩擦的感觉,模仿触摸屏上的形状、纹理和轮廓(例如键盘按键或按钮的感觉)。没有电荷穿过皮肤,因为电荷是通过导电表面上的移动产生的。一种周期性的静电力会产生“变形”手指上的皮肤。
目前,研发进展缓慢,主要停留在实验室,因此,在我们的曲线上的移动非常有限。此外,利用超声波创造触觉的超触觉等替代技术也吸引了更多的技术投资者的关注。
许多研究小组开发了不同的电振动技术来增强触觉感知的体验。最著名的研究人员来自美国匹兹堡、卡内基梅隆大学、法国巴黎苏德大学的研究人员,所有这些研究人员都使用和发展了一种电振动技术,称为静电振动。这种技术利用电振动来控制触控面板和用户手指之间的静电摩擦。芬兰公司Senseg(被国内欧菲光子公司收购)通过在触摸屏上给导电膜的溶液充电而产生触觉反馈,从而产生一个电场,使皮肤产生振动。
最近,韩国电子和电信研究所的研究人员在他们的实验室里开发了一种无玻璃三维视觉的展示解决方案,为博物馆应用提供触控体验。在博物馆的应用中,用户可能有触摸艺术品的错觉。电振动也被原型为手写笔,以复制纸上真正的笔的感觉触觉体验。最近做了更多的研究。虚拟现实技术为虚拟现实应用中的三维表面创造静电振动,传达物体接触或抓取的真实感。
电振动解决方案可以极大地影响用户在平板电脑、智能手机、手持游戏设备、虚拟现实中的3D表面、先进的车载控制设备以及其他消费和工业产品上与触摸界面和屏幕的交互方式。
(二)顶部位置
7 智能机器人
智能机器人是在物理世界中自主工作的机电主体,在短时间内从人工指导的训练和演示中学习,或通过其在工作上的监督经验来学习解决问题。有些机器人可以用语音、语言与人类互动。由于先进的感官能力,智能机器人可能与人类一起工作。
与工业机器人相比,智能机器人迄今被采用的数量要少得多。在过去的12个月里,我们看到一些成熟的机器人供应商扩大了产品线,新公司进入了智能机器人市场(尤其是来自中国)。随着新技术提供者的不断加入和新技术的逐步开放,进入壁垒略有下降。
过去几年,由于几家主要供应商的努力,智能机器人正在备受关注:亚马逊机器人部门(前称Kiva系统)在亚马逊仓库中部署了智能机器人。谷歌收购了多家机器人技术公司。2018年初,LG推出了一系列用于酒店、机场和超市的智能机器人,这是一系列用于商业用途的智能机器人。美国的多家酒店和新加坡的两家香格里拉酒店现在都使用智能机器人提供客房服务。
轻型制造、分销、零售、招待所和医疗保健设施的用户应将智能机器人视为其人力资源的替代品和补充,启动旨在评估产品能力和量化效益的试点项目。我们需要检查当前可部署智能机器人的业务和材料处理流程,同时考虑重新设计流程,为大规模部署提供3至5年的路线图。智能机器人将对各种以资产为中心、以产品为中心和以服务为中心的工业产生重要的业务影响。它们以更高的可靠性、更低的成本、更高的安全性和更高的生产率替代这些行业中的劳动者。典型和潜在的用例包括:医用材料处理、处方配药、病人保健、直接物料处理、库存补充、制成品搬运、产品采摘包装、电子商务订单履行、包裹递送、购物协助、客户关怀、保安。
8 脑机接口
脑机接口(BCI)是一种用户接口,通过计算机来解释或写入大脑中的信号。通常,数据要么被动地被观察用于研究,要么用作控制应用或设备的命令。有三种方法:
➧ 1.侵入性的,电极直接连接到大脑的地方。
➧ 2.部分侵入,颅骨被穿透,但大脑没有。
➧ 3.非侵入性的,在这种情况下,商业上可用的帽子或头巾是用来与来自外部的信号相互作用的。
目前,最好的BCI被用于假肢修复,并且使用100个通道来提取大脑的神经信号。国防高级研究项目机构(DARPA)希望通过他们的神经工程系统设计(NESD)将其改进为100万个通道。DARPA授予了五个研究机构资金来推进这个项目。2017年,Facebook和埃隆·马斯克等大型科技机构对神经链接(超高带宽BCI)的投资达到顶峰,但自2018年初以来,这些项目几乎没有什么消息。2018年初,微软(Microsoft)展示了一款用于应用程序控制的BCI专利设备。今天,在医学领域之外,语音识别、凝视跟踪或肌肉计算机接口提供了比脑-计算机接口更快、更灵活的交互。在大多数消费者或商业环境中,需要戴上头巾或帽子来识别信号,也是一个严重的限制。中国开始在工业范围内使用这种技术,在头盔内部署无创的BCI技术,以检测军事、运输和制造垂直设备中雇员心理状态的变化。
到2022年,无创BCI被认为是最赚钱的部分,预计在预测期间(2016至2024年)将以10.0%的速度增长。随着可穿戴技术变得越来越普遍,将大脑、凝视和肌肉跟踪结合在一起提供无手交互的混合技术将使应用程序受益。在未来五年,随着虚拟现实(VR)硬件的发展,这一技术的无创版本很可能将被纳入VR耳机的设计中。
9 透明显示器
透明显示器是一种平面或弯曲的电子屏幕,由LCD或LED二极管填充,使观看者能够透过设备观看,从而叠加电子图像以增强对物理世界的看法。二极管是夹在玻璃层之间的阵列。电信号穿过发光二极管的导电层,照亮发光层。
今年,汽车行业可以利用挡风玻璃、窗户、甚至天窗作为潜在的抬头显示器,但是透明度和制造成本仍居高不下,尚未达到理想的范围。显示器制造商正在加快努力,将透明的显示器引入汽车、零售和其他市场。将物理环境与增强现实结合起来会带来新的用户体验。例如,在汽车挡风玻璃中,许多提神显示器可以有效地以透明的显示方式呈现。在零售行业,传统的商店橱窗可以变成透明的显示屏,在销售点显示用户相关的上下文信息。在娱乐和表演或视觉艺术中,物理世界和虚拟世界的交互可以带来惊人的创作效果。
10 生物声传感
生物声传感利用不同的传感技术捕捉人体内的自然声传导特性,不同的骨密度、大小以及软组织和关节产生的不同的滤波效应会产生不同的声波信号位置,并通过软件对信号进行感知、处理和分类。这一技术已经在大肆宣传发展,因为它在许多商业可穿戴产品中得到应用,这些产品主要是利用肌肉和骨骼的传导能力。骨传导已经出现在临床助听器和垂直应用的耳机中,如军用野外通讯等。此外,Inomdle实验室已经开发了一种名为sgnl的商业骨传导解决方案,使用sgnl,利用蓝牙传输音频的腕带,智能手机用户可以通过手指尖对着耳朵听电话。
11 启用VPA的无线扬声器
支持云的远场语音捕获设备,将用户连接到虚拟个人助理(VPA)服务,如Alexa、Google助理、Siri、Cortana、微信等。随着2017年启用屏幕的VPA扬声器的出现,多模式交互被引入VPA体验。尽管VPA提供的对话体验仍远不完美,但消费者对VPA音箱的采纳程度高于预期。
12 情感检测、识别
情绪检测或情绪智力是对一个人公开或非自愿交流的理解。它涉及面部表情、手势、姿势、语调、词汇、语音速度、呼吸和皮肤生理学的解释,以破译个人的情感状态。这需要了解社会和文化习俗、环境背景,以及对个人的熟悉程度。系统能够考虑所有这些因素时,情感识别才会导致最佳计算,产生最佳效果。顾客的情绪状态将成为卖家考虑的一个重要维度,基于人工智能的情感识别为数字世界带来了情感智能,不仅改变了人类与技术的互动方式,而且改变了人类如何与他人互动。
当前机器认知有三个维度:面部/身体识别、语音分析和文本分析。目前的研究表明,市场上有一些系统可以提供高精度的面部识别,支持人工智能和云的视频/图像分析和文本挖掘工具也达到了类似的精度水平,最终技术可以通过身体运动来判断情绪状态。
13 机器学习
机器学习是利用能够从数据中提取知识和模式的数学模型来解决业务问题。有三个主要的子学科与所提供的观察类型有关:有监督学习,其中观察包含输入/输出对(也称为“标记数据”);无监督学习(省略标签);强化学习(在某种情况下,评估情况有多好或有多坏)。
机器学习仍然是技术中最热门的概念之一,因为它对企业有着广泛的影响。机器学习持续大规模增长和采用的驱动因素是数据量的不断增长和传统工程方法无法处理的复杂性。
越来越多的组织正在探索用于机器学习的用例,许多组织已经处于试验学习的初始阶段。大多数组织仍然在尝试他们的机器学习方法,找到执行机器学习项目所需的相关角色和技能是像这样的组织所面临的挑战。数据的数量和来源增加,系统的复杂性也会增加,在这种情况下,传统的软件工程方法会产生较低的效果。在未来,许多行业的进步离不开机器学习。
机器学习算法的选择也受到算法是否能够解释的疑问。组建一个(虚拟)团队,对机器学习用例进行排序,并建立最佳评估模型,将最有价值的用例推进到生产。数据是机器学习的“燃料”。数据是各个组织独特的竞争优势,高质量数据是机器学习成功的关键。虽然基本的机器学习算法的选择是相当有限的,但是算法变化的数量和可用的数据源是巨大的。机器学习推动了大量业务和相关问题的改进和新解决方案的产生。
14 手势控制设备
手势控制设备要么是可穿戴设备,要么是用户为了捕捉身体动作、手势和表情而持有的设备。在过去的一年里,手势控制设备几乎没有什么进展。自然、直观的人机交互继续推动着硬件、操作系统和软件接口的创新,但采用的速度还很慢。尽管如此,我们可以假设,大多数交互将是生物识别,最终将取代键盘和鼠标的许多功能。手势控制、自然语言、面部表情、情感检测和触摸构成了输入/输出(I/o)控制组合。人类手臂、手和手指的灵巧性和自然表达方式暗示着手势控制装置。它们易于拾取、佩戴和移除,代表了人类表达的逻辑延伸。
早期的产品示例表明,一个新兴的机会将在两到五年内成熟。对于身临其境的虚拟现实(VR)应用程序,手势控制器(如Leap Motion的Orion)在头盔(Hmd)呈现的虚拟世界中复制手势,如Oculus裂缝、三星齿轮虚拟现实(Samsung)、谷歌的白日梦等。同样,吉他英雄游戏的控制器模仿流行吉他模型的基本形状,捕捉身体和手势的动作,也获得了成功。
15 肌肉计算机接口
肌肉计算机接口使用人体肌肉收缩产生的电信号,通常发生在手臂和面部。肌肉计算机接口技术在过去的一年里没有取得显著的进步,使用肌电信号的可穿戴设备在消费者和企业应用中的使用速度仍然缓慢。
16 神经语言程序
自然语言处理(NlP)提供了人类和系统之间一种直观的交流形式,即NLP包括旨在解析、解释(有时甚至生成)人类语言的计算语言技术。NLP技术处理自然语言的语用(上下文)、语义(意义)、语法(语法)和词汇(词)方面。语音部分通常留给语音处理技术,这些技术本质上是信号处理系统。
企业NLP使用随着能力的提高而增加,以及基于会话代理和自动机器翻译等新的用例。现有的句法和语义为基础的方法越来越多地采用深度神经网络(DNS)的方法。
然而,人类语言是复杂的;虽然NLP解决方案已经取得了进展,但仍有许多微妙和细微之处需要人工干预才能进行适当的解释。
17 虚拟助理
虚拟助理(VAS)帮助用户或企业完成一组以前只能由人类完成的任务。VAS使用人工智能和机器学习(如自然语言处理、预测模型、推荐和个性化)来帮助人们并自动完成任务。VAS倾听和观察行为, 构建和维护数据模型,并预测和推荐操作。可以在多个用例中部署操作,包括虚拟个人助理、虚拟客户助理和虚拟员工助理。VAS应用领域越来越多地被会话接口所主导,如苹果的Siri、谷歌助理、微软的Cortana、IPsoft的Ameliia、Amazon的Alexa和IBM的沃森助手等。
18 混合现实
混合现实(MR)是真实世界和虚拟世界的融合,物理和图形对象似乎自然地相互作用和集成。从概念上说,MR是一种单一的技术。然而,MR包括一组潜在的技术,包括从真实环境数字化到增强现实(AR)和虚拟现实(VR)的各种沉浸式显示和交互系统。
未来几年,MR将成为一种广泛使用的人机接口技术。就像键盘和鼠标让位于触摸一样,未来的用户体验技术将更深入地集成人类与现实世界的自然交互方式。在类似的使用AR或VR的情况下,MR技术可能会成为首选技术,因为它更好地集成对应现实世界和虚拟世界。企业可以使用MR技术来实现新类型的客户体验和用户更个性化的体验。随着技术的成熟,企业应该监控其易用性和能力提升,以最好地确定何时开始研究如何集成和使用这些技术。
19 凝视控制
凝视控制通过眨眼或改变视线的方向来产生智能动作。凝视控制包括确定使用者视觉注意力的角度或位置,通常是通过使用照相机或从眼睛反射的光线,并从映射到这些位置的一组可用指令中进行选择。凝视控制是眼睛跟踪的一种应用,是手势控制(用人眼做手势)的一个组成部分。凝视控制利用眼睛的焦点来传达指令。眼睛跟踪使凝视控制系统能够在智能手机、智能电视、汽车和计算机中工作。Tobii公司在microsoft windows 10和安卓设备上对菜单导航的凝视控制表明,该技术正朝着在各种终端应用程序中真正有用的方向发展。Tobii的眼睛跟踪技术支持下,游戏玩家将能够瞄准武器、引导马车和用眼睛抛绳。
20 智能应用程序
智能应用程序通过使用超级个性化的移动应用体验、服务和知识抽取流程,帮助供应商增加客户体验。该策略依赖于大数据和简单规则集。下一代移动应用将需要提供一种更加沉浸式、个性化和上下文化的体验。要创造这种体验,产品经理需要转向智能应用策略。
21 柔性显示器
柔性显示器是由薄的或柔性的基板构成的显示面板,可以弯曲、滚动、折叠或弯曲而不丧失功能。柔性基板可以是塑料的,也可以是金属的,也可以是薄玻璃的。柔性显示面板可以打印或沉积在薄箔上。柔性显示技术正在迅速发展,真正可弯曲的设备仍在试验中,频繁地弯曲显示后,要改变显示器的形状和恢复形状仍然是一个挑战。柔性有源矩阵有机发光二极管(AMOLED)将支撑柔性显示成为现实,
市场将继续看到更多的带有弯曲显示器的设备,其中嵌入了柔性显示器,但用户弯曲的设备将继续保持几年的时间,直到制造工艺成熟。
检查、测试和修理系统以识别并快速修复缺陷。材料、设计和工艺的不断变化不断增加制造复杂度。市场将继续看到更多的带有弯曲显示器的设备,其中嵌入了柔性显示器,但随意弯曲的设备上市将继续需要几年的时间,直到制造工艺成熟。
柔性显示器将给设备市场带来一场革命,这种显示器可以将多台设备,比如笔记本电脑、超移动设备、平板电脑和智能手机集成到一个设备中。柔性显示器可能会扰乱设备市场,该技术可以为现有设备引入新的形式因素,并完全创造新的设备类别。
22 智能织物
智能织物是指一系列技术,将用于服装、配饰、装潢等的纺织品转变为可作为传感器、开关、连接器、电池或显示器使用的设备。组件和电子产品可以嵌入织物中,或者在某些情况下嵌入纤维内部。智能织物技术随着传感器小型化和与制造集成的发展而不断进步。
技术进步使新型智能织物日新月异。灵活的天线和电源正在市场上销售。这些技术可以像电子线一样绣在布上,以增强电子设备的信号强度或为它们提供动力。
此外,正在开发一种机器人织物,使用嵌入柔性聚合物传感器的棉花,其移动和收缩将允许机器人有感觉皮肤或者给需要它的人提供额外的力量。研究人员正在研究用以智能织物中磁化导电线来存储数据,产生比RFID阅读器更便宜的替代方案。
影响智能织物采用的其他因素包括:智能服装价格高、寿命低、实现高质量的最终产品、清洁而不影响电子元器件、隐私问题和独家营销预算等。
智能织物具有轻盈、透气、防水和耐热等特性,可用于各种应用,包括能量产生和储存、电子控制器、运动监控和加热包装,具有汗液感应能力的智能织物可用于获取诸如肾上腺素、参与度和健康参数等信息,带有肌电图的智能织物(记录肌肉的电活动)传感器可用于为职业运动员测量肌肉活动。
预计智能织物的使用案例将从运动、专业运动员、医疗保健和个人护理扩展到更广泛的行业,包括汽车、制造业、军事、应急服务和工程。电池技术、传感器和电子元器件的进步将使其易于与织物集成,而不会给最终用户带来不适。
23 增强现实
增强现实(AR)是以文本、图形、音频和其他虚拟增强的形式实时使用信息,与现实世界的对象集成在一起,并使用头挂式显示或投影图形覆盖来呈现。正是这种“真实世界”元素将AR与虚拟现实区分开来。AR旨在增强用户与环境的交互,而不是将它们与环境分离开来。
24 头戴式显示器
头戴式显示器(HMD)是集成在头戴设备中的小型显示器或投影技术。HMD在2016年开始批量销售,但设备的价格和有限的可用内容意味着有效的沉浸式和增强环境还为时过早。
25 传感器融合
传感器融合汽车和工业系统已经流行了十多年,车联网、自动驾驶汽车的技术发展不断将汽车传感器的数量推向更高的水平。汽车子系统中的传感器融合已经发展到包括更多样化和更广泛的传感器,如激光雷达、图像传感器、超声波雷达、导航等,以为客户及时提供所需的建议和服务。
今天,传感器融合存在于移动设备、可穿戴、健身和健康监测设备、视频游戏设备、室内导航设备、无人机、车联网和物联网中的其他项目。传感器融合是解释所有不同传感器输入的基础,通过将它们转换成有用的信息所需的“智能”工作。在某些情况下,一个离散的、低功耗的传感器集线器解决方案可以替代主处理器,从而降低功耗并使传感器输入始终处于监视状态。
传感器融合技术可以大大节省电力,延长设备运行时间,使用更小的电池,从而降低了整体材料的成本。此外,巧妙地操纵各种类型的输入传感器可以提供有关设备使用情况、更准确的位置和定位数据以及用户上下文的信息,从而使新的消费应用程序和服务成为可能。
26 语音翻译
当前,语音翻译结合了语音识别、机器翻译和文本到语音技术。2018年发生的两件事加快了语音到语音翻译的市场成熟度和接受可能性:(1)袖珍式硬件设备的出现允许消费者以一种语言输入并接收另一种语言的输出;(2)Amazon web服务的一般可用性,允许应用程序以另一种语言输入。
在深度神经网络(DNNs)的推动下,每一个所涉及的技术都在迅速发展。语音识别正成为主流,并使用专门的硬件(例如,波束形成的麦克风阵列)和软件(信号处理)。翻译已经取得了巨大的进步,文本对语音的使用在多种语言中几乎是自然的,比如亚马逊波利(Amazon Polly)。
值得一提的是,不要把自动翻译看作是对人工翻译的替代,相反要把它看作是在没有人工翻译能力的情况下提供近似翻译的一种方式。
(三)爬坡阶段
27 个人听力装置连接
个人听力装置(PHD)是使用蓝牙技术的辅助听力装置,将音频直接从智能手机流到佩戴者的耳朵。最近的技术进展是使PHD佩戴者能够控制基于互联网的智能家居设备。PHD会放大声音,让穿戴者的语音变得清晰。
世界卫生组织估计,3.6亿人(占世界人口的5%以上)丧失了听力,其中大多数人生活在低收入和中等收入国家。目前,但是PHD不到全球需求的10%。
28 人脸识别
人脸识别是一种生物识别技术,它可以根据先前登记的面部图像或视频安全地识别一个人。2017年,美国运通(American Express)宣布推出安全密钥2.0,支持使用面部识别的认证方法。阿里巴巴集团支付宝(Alipay)正在开发一个带有蚂蚁金融的应用程序,允许用户使用人脸识别技术支付费用。
人脸识别将使带摄像头的机器人/虚拟个人助理(VPA)扬声器成为家庭、零售商店和银行分支机构中的看门狗、管家和助手的混合体。机器人可以具有更自然的人机交互,人们可以与之进行交谈。
29 虚拟现实
虚拟现实(VR)提供了一种计算机生成的3D环境,环绕用户并以自然方式响应个人的动作,通常通过沉浸式头盔显示器(HMDS)。手势识别或手持式控制器提供手和身体跟踪,触觉(或触敏)反馈可以被合并。基于房间的系统在大范围内移动时可以提供3D体验,或者可以与多个参与者一起使用。身临其境的虚拟现实应用比其他图形模拟更先进。
30 生物鉴别方法
生物鉴别方法使用独特的生物或行为特征来证实用户在访问端点设备、网络、移动、联网或网络应用程序时的身份。在广泛的用例中,任何生物特征认证方法都可以在一对一的比较模式中使用。生物识别方法包括多种技术,不同的用例有不同的需求,这种技术所处的位置和所处的时间是最优的。
微软在Windows Hello for Business中对生物识别方法的支持促使了客户对Windows PC和网络登录识别的兴趣。一些生物识别模式,如面部和手势动态,可以在整个会话中提供持续的身份验证,提高信任和减轻“走开”风险,潜在地消除用户不愿意执行超时的需要。在线考试期间,面部模式满足了远程处理的真实需求。被动行为模式为基于分析的工具增加了重要价值,提高了信任度,在某种情境下,这些模式可以提供给机器人检测。
31 语音识别
语音识别技术是将人类语音转换为文本进行进一步的处理。过去三年里,语音识别的性能迅速提高。IBM、微软(Microsoft)、谷歌(Google)、亚马逊(Amazon)和百度(Baidu)等在2016-2017年间都表现出了快速的技术进步,声称自己的表现与人类的转录能力相当。
2018年,谷歌通过提供多种机器学习模型来适应不同的用例环境(例如电话、语音命令、视频),并改进标点符号以提高转录的可读性,从而改进了云语音到文本API的性能。
伴随着算法的进步,语音到文本的应用受到硬件进步的推动,对话代理(如聊天机器人和虚拟助手)的采用,使得企业和消费者在智能手机、游戏机等虚拟个人助理扬声器上采用语音交互。语音对文本技术的应用也在不断增长,用于连接智能家居和汽车领域,以及在边缘设备上运行的嵌入式解决方案,而无需云支撑新的使用场景。
32 手写识别
手写识别系统使用模式匹配将手写符号实时转换为相应的计算机文本或命令。输入设备可以是高级智能手机、可穿戴设备、平板电脑和PC屏幕上的电容式手写笔或手指。
孟海华,上海市科学学研究所产业创新研究室副研究员、博士。文章观点不代表主办机构立场。
◆ ◆ ◆
编辑邮箱:sciencepie@126.com