百度AI交互设计院前沿探路 打造类人交互智能体

百度AI交互设计院前沿探路打造类人交互智能体

百度AI交互设计院百度AI交互设计院 2020-09-15

7月4日- 5日，2018百度AI开发者大会在北京国家会议中心隆重举行，大会上展示了众多落地化成果。此次大会上百度首次举办AI设计论坛，百度设计体验委员会主席、百度人工智能交互设计院院长、百度用户体验中心总经理关岱松及设计团队分享了百度在AI设计和用户体验方面的经验及思考，共同交流AI智能美学及创意等方面的最前沿发展。论坛上百度与湖南大学的战略合作正式启动，整合百度在AI交互设计领域的优势和湖南大学先进的科研能力，双方将共建联合创新实验室及博士后基地，在AI设计领域进行更多更有价值的合作与探索。

百度人工智能交互设计院自成立以来，围绕智能语音交互界面设计节点开展了大量人因工程实验，分享了一系列的研究结论，这些结论已经被写入DuerOS的设备准出准入规范和设计指导原则之中，帮助DuerOS和开发者打造更符合人的需求和习惯的语音交互流程。进入人机交互研究的2.0阶段，百度人工智能交互设计院分享了他们在外观、自然交互、情感交互等领域的前沿探索案例，将AI时代做研究的方法升级，打造类人交互的智能体。

以下为演讲实录：

大家好，我是百度AI交互设计院的研究员李璇，去年11月百度成立了行业内第一个交互设计研究机构，很高兴借此机会跟大家分享我们的研究成果。面对AI时代为人机交互带来的巨大变化，如何通过研究引领交互设计，这是我们持续在探索的问题，而我们找到的答案，是人因工程。

什么是人因工程？通俗地说就是我们做设计，要把人知道的、不知道的自己，以做工程的思维，精准、量化、全面地研究得透透的，然后运用给到设计中。

人因工程不是一个全新的领域。在工业时代，人使用机器来提高生产效率，人机互动是纯物理的机械互动，人因工程研究的是人生理各方面的阈限，基于这些阈限做出在人可以承受的范围内效率最大化的设计。

在信息时代，人使用机器的替代一部分的认知劳动，人机互动是虚拟的认知交流，人因工程研究人的认知规律，来优化信息传递。

过去，人因工程奠定了对人体特征、认知规律进行研究和并运用于设计的基础，到了AI时代，因为人机交互方式和关系的变化，人因工程又有了新的延伸。

首先，AI技术让机器越来越像人，机器可以通过语音、手势、眼神等人类最自然的方式与人进行交流，甚至开始被赋予人的外形。人类不再需要去适应机器，而是机器适应人。其次，AI技术让机器越来越懂人，机器不仅懂我们的语言、肢体，甚至懂我们的动机、文化。此外，当机器越来越像人的时候，人机关系也会发生变化。人们过去对机器是冷冰冰的，但现在会将越来越多对人的情感、需求和预期都投射到机器上，机器带给人的体验变得更加复杂。

所以，AI时代的人因工程，将不仅仅关乎人的能力、行为、限制和特点，也关乎社会、文化和心理，是真正以人类为中心的系统工程。那么在这样的方法论和研究范畴中，我们具体在怎么做呢？

1.0将智能语音作为新交互方式，定义语音交互标准

对于人来说，语音对话是最自然、最高效的交流方式，语音交互是AI时代新交互形态的开端，但其实整个行业对语音交互设计还有很多疑问，为此，定义语音交互的体验标准是我们工作的开始。

首先，我们梳理出五个节点，通过唤醒、响应、输入、理解、输出，人和机器完成每一次的语音对话，为了打造好的语音对话体验，每一个节点都会对应很多设计要点需要被研究和定义。我们系统地梳理每个节点下的设计要点，并在这个框架下去逐步开展精细的实验，以确定最优的机器参数和反馈水平。比如从声学角度，研究了什么样的声音好听、怎么样的唤醒词好发音；从语言学角度，研究机器和人对话，什么样的话术好；从视觉认知角度，研究不同距离下的字号显示……最终我们输出了一系列的研究结论，并应用到了DuerOS的设备准出准入规范和设计指导原则之中，帮助DuerOS和开发者们打造更符合人的需求和习惯的语音交互流程。

2.0打造类人交互的智能体

在完成了对大部分语音交互节点的研究后，我们开始更加深入地去思考如何在此基础上，让人机交互更加类人，让人在面对AI产品的时候更加感知到它是一个智能体而不仅仅是机器。围绕这一点，在这里想跟大家分享我们认为在不久的未来比较重要的三个方面。

外观

首先，我们认为作为一个智能体，外观很重要，它影响着人对AI产品的第一印象和预期。围绕外观，可研究的问题有很多，而经常被争论的一个问题是，智能产品是否应该像人及多大程度上像人，即拟人度的问题，分享一点我们的研究。

我们将拟人度分为面部拟人和全身拟人进行拆解，然后通过实验去研究用户对不同拟人度的认知和喜好度，得到了一些有趣的结果。

比如在脸部造型上，两个眼睛或两个眼睛加鼻子的五官设计是相对比较保险的，增加嘴巴容易形成两极分化，说非常喜欢和非常不喜欢的比例都会增高，所以如果我们要进行拟人的脸部设计，对是否要“嘴巴”需要慎重。在全身拟人的设计上，“手”是一个关键部位，如果想要进行全身的拟人，最好将手带上。

这只是探讨外观的其中一项研究，我们还研究智能产品的设计风格、材质、尺寸、形状等等，并探得了人们对于不同智能产品的外观的认知要点和心理原型。

自然交互

在当下语音交互体验持续优化的基础上，我们认为走向自然交互是人机交互方式的发展趋势。所谓的自然交互是以人为中心，参照人类信息输入输出通道的交互方式。人类通过视、听、触、味、嗅接收信息，通过文字、语音、肢体、眼神、表情等来进行表达。

在人的信息接收方面，视觉和听觉能够满足90%以上的信息需求。所以，机器在自然交互中的信息输出，最重要的是解决如何有效的让视觉和听觉信息相互配合的问题。在这个方面，我们借助眼动仪对用户视觉资源分配情况进行了量化研究，衡量了不同设计方案中视听信息的配合情况。

在人的信息表达方面，语言结合肢体，尤其手势是人类最常见、也最自然的表达方式。虽然人们在生活中经常使用手势，但如何将人类自然手势转化为人机交互语言，目前没有成熟的交互方案，大家都还没有经验。

我们邀请用户来到实验室，去观察要实现各种操作时，用户最自然的手势反应。我们得到了近800个手势，根据通用性和可理解性进行筛选，形成一套最优手势集。然后，借助绿野仙踪的方法，也就是通过后台人为操作来实现的用户体验手势交互效果，我们让用户摆脱遥控器，用语音和手势来操控设备，借助脑电、肌电等技术对操作过程中的情感体验、心理负荷及操作疲劳进行测量，我们去衡量交互操作背后的自然体验，最终筛选出在不同情境和操作下手势和语音配合最优的设计方案，也应用到了DUEROS的设计中。

对于自然交互，我们还会去探讨更多的感知觉通道，来完善自然交互的设计。语音交互还是自然交互，对于机器来说都是交互通道的问题，触碰的是人的感知觉。而继续进化的下一步，我们认为是情感交互。这将是一个很大的飞越，它让机器可以触碰人的内心。

情感交互

情感交互是让机器具有类似人一样观察、理解和表达情绪的能力，而要做到这一点，机器需要对人情绪进行准确地识别和合理的应对。

人与人进行交流时，通过表情、内容、语气语调、肢体四个通道来表达和接受情绪情感。达尔文说过，能够从表情中识别情绪从而对对方的行为作出预判，是动物得以生存进化的重要技能。为此表情无疑是最主要也最被广泛研究的，让机器识别人类情绪的重要课题，我们正在进行这方面的研究。

在情绪应对方面，我们研究高情商的人怎么应对愤怒、挫败等负面情绪，研究咨询师怎么开导痛哭流涕的来访者，研究好朋友和陌生人在表达关心时候的差别，从中提取好的应对策略赋予机器。为了验证这些应对策略，我们在实验中通过VR模拟场景诱发用户的情绪，然后让AI去平复。关于情绪识别和应对的研究，也应用到了机器人的交互设计之中，期待未来跟大家分享更多。

最后，作为专注于研究的团队，我们还想分享在面对这些全新领域时，研究方法上的一些心得。

第一，因为研究领域越来越前沿，我们需要在研究中去创造体验交互和场景。

第二，由于我们追求的是更加多元、立体的体验，我们需要越来越多的引入生理测量来度量交互体验，目前脑电、肌电和眼动是相对成熟的工具。

第三，人脸、声纹、语气等识别技术帮助我们获得大量隐藏在行为背后的数据，如用户的情绪、需求、动机等，而大数据的运算帮助我们构建常模。

过去我们为基础语音交互定义标准，未来我们将投入更多的精力去打造能够进行自然交互、情感交互的智能体。

而基于心理学对人的构建，认知、情感和意志，所以在更超前的地方，我们还可以研究探讨如何赋予机器意志、让他可以有目的、有动机地进行主动交互，以及在类人互动下的人机关系，甚至人和机器两个物种之间的伦理问题。

未来的路还很长，百度AI交互设计愿意与大家进行持续的交流和探讨，一起成为AI交互设计领域的开路者和探路者。谢谢大家！

观察｜官方通报陕西蒲城一职校学生坠亡：事发前与舍友发生口角和肢体冲突认定该生系高空坠落死亡

桐城一派｜倒在“跨年夜”的龚书记，13个字换来免职调查冤不冤？

比佟丽娅还恋爱脑，怀孕7次流产4次，目睹丈夫背叛却选择原谅

市管干部“龚书记”免职迷局

讣告！又一知名女星在家中去世，终年54岁，曾是无数人白月光…