查看原文
其他

突破边界,数智未来新机遇-中国产品设计运营大会分享回顾

爱分享的 百度MEUX 2022-09-27

2022 年 7 月 10 日,由百度移动生态用户体验设计中心联合知群主办,中国用户体验联盟、中国电子质量管理协会和北京邮电大学协办的,第 15 场中国产品设计运营大会「突破边界,数智未来新机遇」专场圆满落幕。


该大会主要针对 0-5 年互联网人,解决互联网人的求职、创业、产品等求职与学习的问题,不同于其它设计大会,该大会更聚焦在职业发展、产品设计、创业心得上,而不是仅分享设计、技术相关的专业知识。



本次大会邀请了多位智能化研究领域的专家,研究方向覆盖了用户体验、企业数字化转型、智能网联营销、人工智能、数字人等多个前沿领域。旨在帮助后疫情时代的互联网人对市场趋势、技术进展有更多维的了解,打开全新的视野,以抓住未来发展新机遇。


吴卓浩 | Mr. HOW AI 创造力学院创始人

毕业于清华大学与同济大学,历任创新工场人工智能工程院副总裁,Google、Airbnb 中国设计负责人。

人工智能与用户体验专家,清华艺科创新院大止科技文创中心副主任,中国传媒大学副教授,辅导过数百个创业企业与成熟企业的产品与服务创新,被全球数以十亿计的用户使用。

2022 年冬奥会吉祥物设计大赛担任评委,在工信部、文化部,以及清华、北大、央美 ArtCenter 等 40 余所大学授课。


马力 | 知群 CEO  最美应用创始人

国内最早一批 UX 设计师,豌豆荚创始成员,创新工场早期成员,前 IBM 产品设计,李开复推荐的设计师和产品经理。

在互联网产品设计、交互设计、用户界面设计、用户增长等方面有十几年的深耕和积累,在知乎有 130 万以上关注者。

北京邮电大学兼职导师,致力于推动互联网专业领域教育。


孟楠 | 中国信通院产业与规划研究所工程师

分享主题:《数字孪生城市与元宇宙》

嘉宾简介:

中国信息通信研究院产业与规划研究所工程师。

长期从事信息化、智慧城市、数字孪生城市领域等的政策理论、行业研究和咨询工作。


李明鼎 | 前字节跳动智能网联方案专家

数字化营销方案专家

分享主题:

《互联网从业者在智能汽车领域的机会》

嘉宾简介:

先后在喜马拉雅、阿里巴巴、字节跳动等互联网公司,从事车联网及车企营销数字化业务。

参与 BBA、南北大众、长安、东风日产、本田、蔚小理等车企智能座舱生态建设,服务吉利、奇瑞、上汽通用五菱、合众、福特等车企的数字化项目。


下面让我们一起来看看本次大会中,百度MEUX的资深用户界面设计师Rick与Sky在大会中分享的《从 AI 数字人度晓晓案例看数智时代设计师的边界突破》、以及《多模搜索智能化》的精彩内容。



///

从 AI 数字人度晓晓案例看数智时代设计师的边界突破


“当下是数字化发展的时代,互联网行业正在飞速发展,我们从百度打造的国内首个可交互虚拟偶像度晓晓出发,去探讨设计师们应该如何突破边界,创造更大的价值。


// 度晓晓是什么?



度晓晓与市场上常见的数字人不同的是,她是具备开放式 AIGC 能力的交互 AI 数字人,有互动陪伴、儿童教育、资讯获取、信息查询等功能场景。

对设计师来说,做这样的设计与做传统互联网设计是很不一样的,整个过程中有很多挑战,包括价值上的挑战、设计能力上的挑战、工程架构上的挑战,还有跨行业认知的挑战。这些挑战总结为一句话就是:设计师要从「在框架之中解决问题」「做面对未知、面向未来的设计」做转变。

这对设计师的能力就有了更高的要求,需要我们不断去挑战自己、突破边界


// “设计师如何突破边界,我也结合了自己的经验和思考,总结了三点建议。”


▎眼界突破

做面向未来的设计,设计师需要能够看到价值,看到趋势,看懂行业。具体来说就是看到我们所做的事情在社会中的意义、事情发展演变的逻辑、行业的构成与运转情况,这样我们才能在面对未知、面向未来的情况下,做出正确的选择与判断。

比如我们为什么做可交互数字人呢?

放眼全球,数字化是非常热门的议题,即便是在公平问题、伦理问题上有些挑战,也是不可逆的趋势。同时数字化也在深刻地改变社会生产的运作方式,也使个体的生活、娱乐、工作更加便利。

在这样的大趋势下,人如何更好地与数字世界连接与沟通是始终存在的课题,人机交互就是这个课题中最重要的一环。



我们再看人机交互的前世今生。

在计算机诞生的早期,人和数字世界的交互成本是非常高的,我们需要花非常大的力气去学习怎么使用这些机器。

随着 PC 的普及,基于窗口图标、菜单指针这种 GUI 界面范式逐渐成型,为整个 GUI 设计奠定了基础。而后又随着触控手机的普及,基于触控的 GUI 成了当下人机交互最主流的范式。

近年来,随着语音技术的成熟,以及手机智能助手、智能音箱的普及,让语音成为人机交互的重要组成部分。可以看到,从握着鼠标到手动触屏再到可以使用智能语音,当代人机交互是机器在逐步适应人的过程。

未来人机交互会如何发展?首先我们需要总结人机交互背后的因素,可以总结为四点:资金投入、技术突破、社会认可、经济普及;再就是通过看领航企业的动作,看各国政府的科技规划,还有技术界学术界的动向。那么我们认为未来人机交互会向着自然、融合、普适的方向发展,未来将是人与数字世界高度共存的状态。


而 AI 驱动的拟人交互将是下一阶段人机交互的典型代表范式之一。当然,AI 驱动的拟人交互也有它的前世今生,它也是从小众到大众逐渐发展来的:早期的拟人交互典型产品是问答机器人,而当下最常见的是语音智能助手;我们认为在下一个阶段,AI 驱动的拟人交互将会以可交互数字人的形式呈现,带来更具情感的体验,与更广泛普适的应用范围。

以上正是我们在探索可交互数字人的原因。 


▎专业突破

做面向未来的设计,设计师就需要拓宽自己的专业边界,成为领域型人才。

所谓领域型人才是指在某个领域具备较广的认知经验与技能,能为企业或组织在该领域去规划、判断、解决问题并拿到结果。这就需要设计师知道自己领域的价值在哪、发展机会在哪、要解决什么问题,并在专业上要建立起更广的专业储备。

那么如何积累专业的技能呢?接下来我会结合度晓晓的案例跟大家探讨一下。

首先要建立该领域的知识图谱,度晓晓是在数字人多模态交互领域逐步建立起来了清晰的知识图谱。



这张图是我们总结的可交互数字人的知识图谱,代表了人与数字人交互的因素和运作方式。

人与数字人的交互是在一定的环境条件下,通过某些特定的交互形式进行的,它们都会受到技术的支撑与影响。环境会对数字人交互通道影响很大,不管是移动终端、驾驶座舱、智能屏或者 VR 等等,都是数字人可能会与人交互的环境,他们之间的差异也很大。

比如,在移动终端上,手持和触控,近距离的交互是它非常大的特点,所以对数字人的唤醒是以触控为主,语音为辅。但在车上和音箱上就很不一样,语音唤醒则是主要的,触控相对没有那么重要。

具体到数字人本身上,我们希望数字人呈现出来是自然的,像一个真正的人一样。那么,除了在外在表现上要自然、美观、协调,更需要在内在层面上给用户表现出像人一样的思维,像人一样的表达,甚至像人一样的创造能力。而这背后需要自然语言技术、语音技术、推荐算法技术、计算机视觉技术、计算机图形技术等作为基础和支撑,让数字人的输入、加工、输出这种交互模式能够很好地运转起来。


我们设计师除了为数字人打造外在的因素,如造型、表情、音色、动作外,在数字人的内在层面,数字人所呈现出来拟人化的表达与情感,这都需要我们在交互过程中,针对具体的场景,呈现出生动的脚本。因此,数字人生动的性格,3D 动作表情的综合运转融合,离不开设计师的精心打磨。

以上就是说明我们需要对领域有较广的认知,建立自己的知识图谱。有了自己的知识图谱,才能在所从事的领域形成解决不同问题的模式化经验,不断优化自己的范式,极大提高解决问题的效率。


“下面我还是结合度晓晓的案例,分享形成移动终端沉浸式 AI 数字人智能助手的界面框架范式——SCCC 界面框架范式。”



在移动端 APP 内,数字人需要给用户提供沉浸式的交互体验。所以,整块屏幕里晓晓需要伴随式地出现,不能过多占用注意力。我们可以把它视为一个三维空间,把界面划分为四个层级,分别是空间层、角色层、容器层、控件层

在交互过程中,空间层需要起到营造氛围的作用。为此我们打造出了景深的切换、机位的切换、氛围的变化和个性定制的能力,使其能够烘托整体氛围。角色层作为数字人最核心的部分,必须是可以迁移到其他终端复用的一套通用的能力。相应地,设计师要提供造型、表情、动作设计,以及典型的交互行为的脚本设计。剩下的就是承载内容的容器层和承载用户操作的控件层,这四个层级互相配合,才能让多模态的交互能够顺利完成。

遵循整个界面框架范式,我们把度晓晓融入在了百度 APP 里,其实也是证明了这个范式的可靠性。

以上是我对范式的一些经验。在所从事的领域形成经典的范式,可以提高我们解决问题的能力和效率。


最后就是方法,方法是指设计师如何去做事情的具体经验。这里为大家介绍数字人交互行为的导演式设计方法。这套方法由四个环节组成,分别是:积累原始资产、构建运作框架、导演脚本编写、动态小样验证。

前两个环节需要前置构建的基础,后两个环节是具体的应用。AI 数字人度晓晓的交互行为是通过语言、动作、表情来传达的,我们需要通过动作捕捉、blendshape 等方式去积累角色动作表情的标准化资产,并将其承载汇集在一起,便于团队成员协作取用。在完成积累原始资产后,我们还要将不同的资产融合在一套策略里运作起来。


数字人的交互设计比传统的 GUI 交互复杂很多,设计师更像导演的角色,要考虑场地、服装、演员、台词、演技、镜头等诸多因素。通常在设计一套行为流程时,会先进行真人预演,确定是否符合想要传达的意思和感受,同时也要将多出来的因素跟传统的 GUI 以恰当的方式、时机做结合。

最后就是验证这种编排能否在最终的环境里运行起来,是否符合我们的意图想法,这一环节是非常重要的。


这里分享给大家一个经验,设计师在做数人交互时,总是将行为编排得过于丰满,这就会使数字人表现出特别拖沓的感觉,所以完成交互后的第一步就是砍数字人的动作。

最初阶段,我们的验证方式是通过传统的 3D 动画软件渲染,然后导出视频去验证结果。虽然能达到目的,但是成本很高,修改起来也很复杂。经过一段时间的摸索,我们与 3D 引擎的研发工程师建立了决策行为的脚本接口和规则。利用简单的代码配置,直接验证编排脚本的效果,大幅度提升了效率。

这就是我的第二个建议,专业突破,成为领域型人才,看到机会,找到问题。然后积累自己的知识图谱和范式方法,去解决这些问题


▎思维突破

在完成眼界和专业的突破后,思维突破可以帮助设计师将积累的能力真正地在企业中发挥出来。这里的思维是指设计思维和工作思维

双钻模型是一种经典的设计思维模型,它聚焦于具体的发现问题、洞察问题、解决问题。为了应对面对未知、面向未来的设计,我们基于双钻模型做了一些小的扩展,这里把它称之为前瞻设计思维模型


这个模型是希望设计师在解决具体问题前能够跳出来,从更大层面去看自己做事情的意义是什么,发展方向在哪里。这样在面对具体问题时才会有更准确的判断,也就是突破传统,扩展自己的边界

面向未来的设计往往不止一种,这就需要我们分清主次,从通用性的问题入手,多方向探索。当设计师跳出来以后,眼界突破了、专业也突破了,就能够看到更多,也会具备相应的技能,这个时候我相信你就会有自己的主见,有自己的判断。

工作思维的突破,我们需要从被动式工作转为主动式工作。被动式工作是别人告诉你去做什么,然后你去执行。主动式工作,是你告诉别人应该做什么,然后带着大家取得结果。

在眼界和专业上具备能力的设计师,就需要主动式的工作,才能把价值真正地发挥出来,这里也需要设计师去积累自己的表达能力、沟通能力、体验能力。

以上就是关于设计师如何突破边界的三点建议。



///

多模搜索智能化


“事物发展的本质方面要想变得更加智能,会有很多影响因子,当下我们处在一个智能化升级的时代。那么,搜索在智能化的过程中扮演什么样的角色?多模态又是如何进行实施的?”


// 智能化影响因子

智能化影响因子主要有两方面,一方面是感知体验升级,另一方面是内容形式进化。


▎感知体验升级

很久以前人们会用烽火台传播信息,但受天气影响,这种传播方式具有局限性。随着信息技术的发展,从声音信息到飞鸽传书,再从电话机到现在的智能电话,信息的传播方式在不断地进化。

整个进化过程的本质,其实是我们对于信息感知体验的升级,是在不断地调动视觉、听觉、触觉的感知,加强我们对于各种信息的认知。

以前想象不到我们现在能用到智能电话。当时代发展到这个阶段后,才会有这样的认知形成,这就是在信息传播的方式中存在的影响因子。


▎内容形式进化

由于受到流量的限制,以往的内容形式比较单一,基本都是文字和图片的形式。但随着整个信息技术的发展,视频已经成为了最常见的内容形式。

越来越多的用户关注短视频内容,其量级已经达到了比较强大的规模。5G 在市场规模越来越大,6G 也已经在探索中,这些因子最终影响的就是我们整个时代从信息化到网络化,云化最后到智能化的状态。


// 搜索的感知因素

关于搜索主要是通过图像识别、语音识别、文字识别等方面来完成的。其背后是有一套本质的感知因素所影响,主要包括两个部分。


▎感知因素-基础

我们工作中常用的是智能化-基础部分。比如,设计师会更多地关注人机交互在用户使用的过程中,让用户感觉很智能。

那么,这种智能主要是体现在哪些方面?比如,在使用一些产品界面交互的过程中,整个路径很高效,使用操作很便捷等等。这种人机交互的层面,可以定义为智能化的基础,主要是由我们去跟机器进行基础的互动所产生的。

感知基础比较简单,就是希望我们给用户传达的是使用起来是很便捷的。让用户在使用过程中感觉这个产品非常可靠,并且能够给用户提供很多帮助,从而觉得这个东西好用。


▎感知因素-人

在感知因素的上层,我们希望机器变得越来越智能,即这个智能应该具备人的思想。正如我们的大脑是非常智能的,因为有很多能够自主做判断的思维存在。想要机器变得很智能,我们就要从人的五感层面去做突破,去捕捉这个人的某种行为。

比如,在做 APP 时我们会把某些导航设定为固定的导航。在这个设置里面,我希望用户 A 在搜索红酒以后,就会变成他的个性化频道。当他下次再过来的时候,红酒就会成为他的常用频道。而其他的用户没有类似的搜索行为,页面就会呈现出千人千面的交互形态。

如何使机器具备自主判断的思维?这就需要我们在交互上做一些设定,让机器变得更智能,能够准确地理解我们的意图。


// 模态设计的形式


▎模态1-文本

百度一下是传统的搜索模式,其逻辑主要是用户通过搜索框输入问题,最后展现出各种各样的结果。这种搜索方式能带给用户不同程度的满足,这就是所谓的头部的精准满足。

但这里也会有一些特殊情况。机器没有理解用户的意图,导致搜索结果出现很多比较宽泛的结果,因此用户只能在此基础上做筛选,寻找更加符合的答案。这种模态是传统意义上基于文本 Query 的满足形态。


对于视频内容我们如何满足?之前只能通过文本 Query, 跟内容的文字之间建立一种满足的关系。但是,视频是动态的展现形式,导致这些信息无法通过文本直接呈现出来。因此,我们需要去探索其他的满足形态。

比如,我们会拆出来视频里的一些信息去做节点层面的满足,即真满足。由于每一个节点或许与问题之间存在一定的关联,这就变成更新的满足形态。

再比如,在做信息浏览的过程中,我的意图是希望能看到下一个视频,这个时候如果机器可以理解这个意图,那么下一个视频就会变成可播的状态,向上滑动视频就会变成另外一个状态。

这些都是在训练机器对人类意图的满足,通过做一些模型的训练,让机器变得更加智能。

每个用户搜索的东西都不尽相同,呈现出问题的多样性。不同的问题提供不同的答案,体现的是满足的多元化。我们需要做的工作是通过智能化去连接问题的多样性与满足的多元化。


▎模态2-视觉

搜索在视觉方面同样做了很多满足用户的事情。因为只用文字表达事情是有局限性的,生活中确实还有很多丰富多彩的表达形式。比如,我在路上遇到一辆车,我想知道车的品牌和型号,那就可以通过拍图的方式进行搜索。

包括我们给父母买的国外保健药品,由于成分都是用英文表达的,父母可以通过什么样的形式直观地去了解它的成分、药效、使用方法等。

或者是我们去植物园看到不知名的植物,我们同样可以通过拍照搜索,然后获得详细的介绍。这些都是视觉模态在我们生活中的应用。


▎模态3-语音

前面提到的更多的是偏视觉搜索的模式。同样的,语音也是一种比较好的模态形式。如果声音只是一个基础,那声音的背后也是人。

在形态上,我们考虑通过语音模态来完成数字人相关的升级,希望可以有助理的感觉以及人的思想。最典型的案例就是度晓晓,我们想要在用户使用的过程中有氛围感。为此,我们借助基础的体验算法,让整个环境背景跟我们的音波、主体物之间产生共鸣关系。这一系列的改进也正是基于环境设计层面的一些智能化方法。


▎多模态-融合

无论是输入文字图片,还是以语音的形式搜索问题,得到相关的满足。这些都是属于单一的模态。更深层的应该是,我们需要把这种单一的模态形式进行融合,以此帮助用户达到更加充分且多元化的满足。

什么是多模态?多模态是如何进行实践的?这里列举一个比较场景化的例子。我们平时在拍照的同时可以向机器询问这是哪个地方,它就会基于拍照与文本二者综合的 Query ,展现出一个更加精准的答案。

类似下图的实例 demo,我们对主体物进行识别的过程中,也可以询问机器这是什么种类的植物?这些信息的输入,我们都可以通过多模态融合的方式,使其得到更精准的满足。



最后,关于智能化提出一个观点,很多人都希望所有的东西可以智能化,但并不是所有的东西越智能越好。正如我们家里装的全屋智能开关,虽然可以通过语音操控实现我们想要的结果。但是与智能开关对话的过程,反而是增加了我们达到满足的时间成本,因为它需要花时间根据我们的语音进行反馈。

如果这个灯就在身边,可以直接动手操作,很快地满足想要开灯或者关灯的需求,不需要再繁琐的与智能开关进行对话。这就恰恰证明了在某些场景下,有些东西并不是越智能越好。

所以,我们在整个构建智能化的过程中,需要去平衡是不是越智能越好,去思考基础部分的交互融合能够用什么样的度去做参与。


未来,百度MEUX期待着能与更多媒体、组织连接,共享设计价值,拆掉思维的墙,为业务提供更多元的输入!




感谢阅读,以上内容均由百度MEUX团队原创设计,以及百度MEUX版权所有,转载请注明出处,违者必究,谢谢您的合作。申请转载授权后台回复【转载】。


也欢迎加入MEUX,视觉/交互/运营设计师

可投简历至MEUX@BAIDU.COM

(注明信息获取来源如:公众号)

以下文章,你可能也感兴趣

⬇️

译文:想要为元宇宙做设计,这些可以帮到你

百家号品牌视觉语言焕新-源于发现 体验美好

好看视频PC站浏览体验升级

对话河南卫视-年轻化趋势下的传统文化新表现形式

视频搜索体验价值论

关于我们:
MEUX,百度移动生态用户体验设计中心,负责百度移动生态体系的用户/商业产品的全链路体验设计。服务的产品包括百度APP、百度搜索、百度百科、百度贴吧、百度商业产品等。MEUX以「简单极致」为设计理念,创造极致用户体验的同时赋能商业,推动设计行业的价值和影响力,让生活因设计而更美好。

“在看”我吗?

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存