薛志荣 | 自由微信 | FreeWeChat

高三女生醉酒后被强奸致死？检方回应

高三女生醉酒后被强奸致死？检方回应

波罗的海，电缆断裂！

川普的成长秘辛：家庭和大学如何塑造一位“坚刚不可夺其志”的总统

萝莉岛事件背后所隐藏的真相，可能比我们想象的更恐怖

薛志荣

充满科技力和想象空间的Vision Pro

Pro是我近十年来见过最具科技力的消费级产品，没有之一。无论从硬件参数，系统设计还是用户体验，目前没有一家XR产品可以跟Vision

2023年6月6日

人机交互设计知识库 2.0

人机交互设计知识库从去年5月份正式推出到现在已经1年了，在这个时间内我更新了将近2000条知识，涵盖了100多个标签并设立了9个专栏，如下图。在这接近2000条的知识里我总共沉淀了719条精华和828份文档，其中包括了2022年和2023年里我认为比较重要的资讯、前沿视频、行业报告、设计规范、专利和论文（含CHI

2023年6月1日

Next Thing：角色+模型+流程+接口调用

的工作流程包括四个阶段。从工作流程来看，HuggingGPT非常适合意图明确或者流程简单的任务，因为它在第一步决定了后面3步是什么，但最终结果会根据不同的预测得出结论。任务规划：使用

2023年4月26日

我的第三本书，《写给设计师的技术书》终于要上市了！

时隔一年后，我的第三本书《写给设计师的技术书》终于要出版了，以下是我三本书的大合照，为什么照片里会有4本书呢？因为我第一本书《AI改变设计》最近在台湾也出版了，不得不说台湾的出版社在改名字方面真是一绝。我的第三本书受众将面向从事智能交互工作的设计师，如果你正在从事或者考虑未来进入该领域，我相信这是一本你需要读而且能读懂的技术书。怎么理解“需要读”？因为在当今AIGC、XR和智能座舱各个领域都在蓬勃发展的智能交互时代，技术的变革会直接决定了你的设计和体验是否成功甚至决定了设计师的工作内容。如果正在读这篇文章的你参加过以上领域的设计，相信以下问题会在某个阶段困扰过你：我怎么能迅速切换到一个全新的领域？怎么感觉产品经理把我的活做了？设计师和产品经理的职责怎么会越来越模糊？怎么感觉这个体验问题是技术导致的？我怎么推动体验的改进？但好像这个问题我参与不了？除了GUI界面设计我还能做什么？这个体验设计我好像只需要设计图标就行…相信最后一个问题对设计师的困扰是最大的，越无感和越自然的交互体验，用户可以看到的GUI界面可能就是一些图标，例如手势交互、眼动追踪控制选项的切换。那设计师不可能到头来只画图标吧？公司也不允许养着一群设计师来解决图标好不好看的问题。如果在你的工作中遇到以上困扰，我认为懂技术是非常重要的。我一直认为“技术是设计的灵魂，设计是技术的表现”。设计师只有掌握了灵魂，设计的界面表现才会自然和灵活。那么什么是灵魂？我认为它是一个看不见的状态机，我们做的交互设计就是在设计这个状态机，只不过在互联网和移动互联网时代它跟界面流程强相关，但在智能交互时代，状态机的设计不一定跟界面流程挂钩，而是跟技术实现、场景和用户行为挂钩。怎么感知、理解场景和用户行为的变化以及输出合理的结果将会是每一个状态机的工作，而技术实现和内部逻辑决定了状态机的质量。技术实现也决定了状态机的设计逻辑，所以了解技术将会是每一位身处智能交互时代的设计师的必修课。那么设计师怎么才算了解技术？需要写代码和了解理论知识？不，我不这么认为。代码和理论知识固然重要，但我认为智能交互时代下的设计师的工作是设计好状态机的输入、输出和交互逻辑，他们的工作更像是一个架构师，所以我在《写给设计师的技术书》的时候会将它定义为一本科普书和工具书，重要章节将会从基础知识、实现技术、案例拆解和设计注意事项4个方面让设计师了解每项交互技术是什么、能怎么用，这也是上文提及的“能读懂”。如果对这本书感兴趣的朋友可以阅读下图并在下方二维码扫码下单，对了，当前预售还5折。我相信在阅读本书后，你将能够更好地理解技术与设计之间的关系，更好地掌握智能交互设计工作的核心，提高工作效率，并为自己的职业发展打下坚实的基础。《AI改变设计—人工智能时代的设计师生存手册》终于上市了！三年后我的第二本书终于要出版了

2023年3月27日

共享两篇GPT-4的中英文版官方报告，欢迎自取

昨晚OpenAI开的发布会，以下是中英文字幕的直播视频：同时OpenAI发布了两份关于GPT-4的官方报告：需要这两份GPT-4的中英文版报告的朋友可以在公众号回复“OpenAI”获取。

2023年3月15日

发现有趣的人机交互 007期

分享一份最近推出的国标《学术论文编写规则》，需要该文档的朋友可以在公众号回复“007”获取。以上内容摘自笔者正在构建的人机交互设计知识库，该知识库主要涉及XR、数字人、普适计算、智能座舱、AIGC

2023年2月27日

发现有趣的人机交互 006期

Diffusion。现在它引入了一种新模式：“Gen-1”可以将现有视频可视化地转换为新视频。通过简单的文字提示，可以将逼真的火车门变成卡通风格的火车门。3.

2023年2月13日

使用Notion AI后的几点看法

AI，以上内容基本都是通过这种方式实现，如下图。第四种方式是插入跟AI相关的Block，如下图，寻找起来比较麻烦，因为处于较后的位置。从这四种交互方式，我们能看到Notion已经将Notion

2023年2月7日

志荣祝各位读者新春快乐！

很不一样的2022年即将要过去了，志荣在此提前祝大家在新的一年里能够大展宏图，万事如意，大吉大利，但更重要的是身体健康，阖家幸福！在过去的一年里，我和Mixlab的Shadow制作了一系列关于超级个体个人成长的直播，这次我们将它们整理为专栏（总共6场1.5小时以上的个人成长经验分享），欢迎感兴趣的朋友订阅（春节期间我们还特意准备了多张8折优惠券给大家）。除此之外，我制作了5张人机交互设计知识库699-400元的优惠券，这将是今年做出最大力度的优惠，没有之一，欢迎大家一起交流学习。我也特意向Shadow争取了10张元宇宙·知识库699-400元的优惠券（这里面的干货内容特别多），也欢迎对元宇宙感兴趣的朋友加入该星球一起学习、探索相关知识。最后，我和Shadow一起运营的新品牌MiX正式上线，年后这个公众号将会更新更多关于跨学科的知识和经验分享，欢迎大家关注:-)

2023年1月20日

发现有趣的人机交互 005期

技术会扫描您的面部，并根据您的个人结果提供各种建议——从微刀片和微阴影到各种填充效果——以努力“在几秒钟内为消费者提供最精确的眉毛形状”。2.

2023年1月16日

给人机交互设计知识库做个总结

人机交互设计知识库从今年5月份正式推出到现在已经7个多月了，现在我来总结一下期间我做了什么？在这段时间我总共添加了1046条内容，涵盖了100多个标签并设立了9个专栏，它们分别是：可能有人会问标签有什么用？标签的作用是构建一个网络，它能让你知道跟这个标签相关的内容有哪些，例如下图的Google标签关联了人脸追踪、无障碍设计，而无障碍设计能让你看到苹果在这方面做了什么。总的来说，我建立人机交互设计知识库的目的就是要构建一个知识网络，让我和用户能第一时间找到最相关的内容。在这七个月里我共沉淀了367条精华和521份文档，内容包括法规、论文、设计规范、专利和行业报告，里面的内容基本都把外文翻译了（在这里我基本花了1500元来机器翻译内容）。好的，有人会问为什么你要翻译成中文？这明显是为了提升自己的浏览速度...除此之外，还有上百个视频帮助大家理解和吸收新知识，类似下面的视频都是我在浏览网站时看到有好内容花功夫保存下来的。我也在构建新的而且很重要的内容：设计案例和工具箱。设计师做设计时最重要的是有灵感提示和案例，所以设计案例就是为了解决这个问题。考虑到很多用户不一定有技术基础，而且在人机交互这个跨学科领域相信没多少人敢说自己什么都懂，所以工具箱的存在就是降低开发成本，尽量做到开箱即用。这两个标签将是我未来发力的重点方向。除了以上内容，我在星球内外举办和分享了11场知识和经验直播，星球用户都能获得额外的优惠甚至免费聆听。总的来说，在这短短7个月里，已经有300多位付费用户加入星球，我在11月份做过一次NPS调查，满意度为8.1分（10分满分），说明星球的内容还是能帮助到星球内的用户。我相信也敢保证，随着时间的流逝，人机交互设计知识库一定会成为国内外人机交互领域知识含金量最高的知识库之一（目前没看到有其他知识库）。为了这个目标，我真的把人机交互设计知识库当做产品来做，我也非常感谢我的读者以及星球用户愿意相信我的专业能力并花几百块钱进入我的知识星球。沉淀1000条知识后，我决定在明年（也就是明天）将价格从原来的549元提升到699元。迷幻的2022年今晚终于要结束了，在此我先祝大家在2023年都能顺风顺水，事事如意。借着这个假期我制作了一批大额优惠券，如果对星球内容感兴趣的朋友可以在此领取优惠券加入星球。

2022年12月31日

发现有趣的人机交互 004期

1.分享一个笔者认为很不错的插件，跟ChatGPT有关，它可以极高效率地帮你完成在浏览器内的输入或搜索任务。https://merlin.foyer.work/2.分享一个在YouTube上播放500万次的视频，这个视频是09年TED上Pranav

2022年12月19日

发现有趣的人机交互 003期

大会官方公布了最佳论文等多个奖项。其中，最佳论文奖由北京大学刘利斌团队的论文“Rhythmic

2022年12月12日

问了一下ChatGPT：设计师应该如何利用人工智能？

中，转到扩展页面（chrome://extensions或edge://extensions）。启用开发者模式。将解压缩的文件夹拖到页面上的任意位置以将其导入（之后不要删除该文件夹）。

2022年12月11日

发现有趣的人机交互 002期

1.AR眼镜能否彻底改变产品摄影？Shopify商家的未来工作会是什么样子？https://twitter.com/StrangeNative/status/15780221218836766732.Adept

2022年12月5日

MiX-Talk 006：对话人机交互设计师和作家薛志荣

对话作者薛志荣如果想了解「超级个体」个人发展分享系列更多嘉宾的信息，可以浏览以下内容：「超级个体」个人发展分享系列介绍MiX-Talk

2022年12月1日

发现有趣的人机交互 001期

Kozlowski的一个作品，作品背后主要使用了姿态识别技术。https://www.instagram.com/p/CF2HtoQH51z/3.Meta开发的Interaction

2022年11月28日

对话Maker&多年跨界学习的斜杠青年00

001：对话设计黑客&社区架构师ShadowMiX-Talk

2022年11月24日

MiX-Talk 004：对话Digital FUN和TEA社区创始人Totti

003：对话未来出行实验室主理人王亚辉博士设计师如何在智能化时代持续学习和成长？《AI改变设计》新书首发

2022年11月18日

对话未来出行实验室主理人王亚辉博士

002：对话Figma布道师Hal设计师如何在智能化时代持续学习和成长？《AI改变设计》新书首发

2022年11月10日

MiX-Talk 002：对话Figma布道师Hal

001设计师如何在智能化时代持续学习和成长？汽车专业风光不再？听听青年学子怎么说《AI改变设计》新书首发

2022年11月3日

MiX-Talk 001：对话设计黑客&社区架构师Shadow

Shadow我们只是Infinite

2022年10月26日

「超级个体」个人发展分享系列介绍

Hi

2022年10月21日

HCI知识库分享会005：智能座舱多模交互体验设计

大家好，HCI知识库分享会已经举办到第五期，这一期将由我来分享一下智能座舱多模交互体验设计，以下是这次分享的时间点。多模交互是近几年智能座舱一直在讨论的话题，我有幸在2019年主导了一款车型的整个GUI和VUI融合的系统设计，并在后续几年内我一直在学习和参与智能座舱的前沿设计，这次借HCI知识库分享会这个平台我会讲一下这几年我对于智能座舱多模交互的设计心得，包括GUI和VUI的区别，以及融合时出现的问题和注意事项，最后会预留一定的时间来答疑。这次分享内容将面向「人机交互设计知识库」、「智能座舱人机交互知识库」和「元宇宙跨学科知识库」三个知识星球的用户进行分享。最后，给人机交互设计知识库进行一个简单的介绍。人机交互设计知识库主要涉及XR、数字人、普适计算、智能座舱4个大方向，目前已经归档了600多份材料并打了100多个标签，包括各种书单、论文、文档、网页和视频，欢迎对这次分享内容或者人机交互感兴趣的各位读者加入。#

2022年9月21日

[嘉宾访谈]HCI知识库分享会004：自动驾驶体验设计的差异

百度在辅助驾驶和自动驾驶方面的技术沉淀在国际上是数一数二的，相信很多来自车企的读者也想知道百度是怎么思考以及做好智能驾驶体验的。为此，HCI知识库分享会第四期我邀请了我的好朋友絮宁为我们深度介绍一下自动驾驶体验设计，以下是主持人和王絮宁的访谈内容，对视频回放感兴趣的读者可以在知识星球“人机交互设计知识库”中查看。主持人：自动驾驶的体验设计往往受技术（算力、传感器等）影响较大，例如分享中提到的自动驾驶的开启和退出，以及驾驶状态和能力边界的显性化。设计师应该如何看待技术对这个体验设计的影响？王絮宁：从体验设计本身来说，并不只是做自动驾驶能力的设计，我们要做的是整体的用户体验设计，对于技术能力的表达也是用户体验里的一部分。如果传感器很多，可能它的产品能力会很多，这时我们需要表达和解决的问题也会很多；如果传感器少，我们更需要让用户知道当前的自动驾驶是安全的，用户想知道的信息也都是能知道的。设计师要通过体验设计来规避一些技术能力上的不足，所以我们并不是说为了匹配技术能力去做设计，而是在为驾驶体验来设计。主持人：自动驾驶产品学习成本往往比较高，其技术边界和限制比较隐含，很难通过简单的界面元素或图标去传达，而一旦操作操作失误，带来的后果会影响驾驶安全。我们如何去提升用户对智能驾驶服务的了解呢？在这个具体的工作中有哪些有意思的尝试？王絮宁：我觉得可以从几个维度来说：第一，使用前期让用户先学习了解这个产品。这方面小鹏已经做了很多，在使用自动驾驶能力之前，先让用户通过一个更直观的方式去学习自动驾驶产品的使用方式和能力边界。第二，使用过程中，给用户一个更好的预期。尽量不要让用户在非常紧急和危险的状态去面对可能会触碰到的自动驾驶边界。我们可以通过一种可预期、推荐或者是介绍的方式告诉用户在哪些场景下可能会出现哪些问题。第三，在目前自动驾驶能力还不能支撑全无人、没有安全员的驾驶状态下，我们尽量把用户融入到整体的驾驶过程中，而不是让用户非常放松的在车上睡觉、玩手机或者是使用各种方法规避方向盘上的脱手监管。我们应该让用户更多地介入到自动驾驶过程中，让用户知道此时还需要通过人脑的智能去判断一些场景，才能够让他不要对这个产品产生过度的信任，而是在心中有一根弦儿。主持人：相对于传统的网页或者手机，影响智能座舱产品设计的因素非常多，设计过程中要考虑很多种软硬件协调配合、多模态交互，以及多个供应商合作。这种复杂的协作模式下，作为某个局部模块的设计师，如何真正有效地构建及落实以用户为中心的体验设计？王絮宁：这个其实不单单是设计问题，而是设计师角色的问题。自动驾驶的设计师不能将自己定位为单纯的设计师，我们可以在前期更多地了解技术、整体运营，在后期跟踪户反馈等，这些都能帮助设计师在整体设计过程中更好地落实用户体验。“以用户为中心”是把自动驾驶的设计当成一个单独的设计方向，还是将我们的设计方向扩展为“让用户在驾驶行程中更舒适、体验更顺畅”？如果是后者，那是一个体验为中心的设计方式。主持人：百度目前在自动驾驶领域有多个方向的探索，有minibus、robotaxi等L4以上的自动驾驶服务。这些自动驾驶服务往往会限定在特定园区或区域，例如北京的亦庄和首钢园。为什么需要限制一个园区运营，除了政策是否有其它因素的考量？王絮宁：主要是政策原因。政府开放了某个区域的自动驾驶行驶权，我们才可以在这个地方运营。不同的运营区域有不同的特点，具体运营也会有不同的侧重点。例如首钢园是一个用户游览体验高科技的园区，我们会在这个园区投放更多的试点功能，像副驾安全员或全车无安全员（一般安全员在主驾），就会在首钢园进行试点运营。例如在亦庄运营区，更多的是考量用户上下班的运营和使用效率的提升，主要考虑细节和比较落地的问题。像minibus一般会接入文创园区，我们会定制化地去做车型和方案的设计，将这个园区的特色融合进去。这些都不同运营区域所需要考虑的设计差异点。主持人：在北京的首钢园和亦庄，robotaxi已经运营了一段时间。在这个已经运营的区域内，大家一般是怎么在使用无人驾驶出租车，他们的主要使用场景是什么？王絮宁：首钢园参观的人比较多，全国各地到这儿来玩、参观体验，对新科技比较有兴趣的人就会约一下体验。亦庄更偏向一个常规运营的状态。约车的人大部分都是在亦庄工作和生活的人，所以我们可以看到，早高峰晚高峰时亦庄运营的单量是非常高的。原因有两方面：一是我们本身有优惠政策，价格比网约车要便宜；第二是，大家已经把它当成一个相对比较常规的网约车而不是自动驾驶车，对于想要出行或回家的诉求，约自动驾驶车和约普通网约车都是一样的，我只要能达到回家的出行目的就行了。主持人：目前全国有哪些参与了自动驾驶运营的城市？王絮宁：挺多的。最近新开城的是重庆和武汉，如果有重庆和武汉的朋友想要体验可以在“萝卜快跑”公众号、APP、微信小程序、手机百度APP等渠道进行体验预约。主持人：接下来的问题是关于多屏幕信息展示的。目前汽车整体座舱的信息展示渠道越来越多，可能会有HUD、仪表和中控等各种不同的信息展示媒介。对于自动驾驶而言，我们如何去看不同显示媒介的优劣？王絮宁：我们不应该说不同显示媒介的优劣是什么，而应该关注组合使用这些显示媒介，如何利用不同的屏幕，用最自然的方式去呈现最适合当前角色的信息。虽然现在AR-HUD能力并不多，但是我们之前有过设计探索——我们会将这个更趋近于当前道路的信息呈现在AR-HUD上，因为AR-HUD区域驾驶员能够自然视线直观查看路面内容；另外我们会把一些增强现实的东西也放到AR-HUD里。仪表比HUD的信息获取效率要稍微低一点，所以我们会把需要驾驶员关注的解释类信息，或者是需要关注的行为引导，以及一些文字比较长的内容留在仪表上去展示。中控屏的使用者有两个角色：驾驶员和副驾。我们更倾向于展示偏整体路程的信息，中长距离预期类的信息，还有一些周边引导类信息。目的是让副驾也能够了解车辆的行为，但不对其进行过多干扰。另外也是让副驾也能有一些驾驶中的乐趣，而不是完全受制于驾驶员的操作。对于后排屏的乘客来说，我们更多的只是让他知晓当前的驾驶行为，但不会释放太多控制权利。总结起来，我们可以根据不同用户对信息的诉求去考虑信息的展示，也可以根据不同媒介的特点去进行内容信息的划分。主持人：目前座舱的仪表屏幕有越来越小的趋势，有些车型（理想L9）甚至取消了仪表屏。这种趋势对自动驾驶HMI设计的影响？王絮宁：这对应的是一个趋势，是智能化或者是自动驾驶能力逐步提升的必然结果。当智能化能力逐步提升，驾驶员对车辆的控制需求会越来越少。驾驶过程中，车辆会主动通过记忆或者是智能推荐帮驾驶员完成一些操作。自动驾驶帮助驾驶员从驾驶任务（对道路或车辆的监控）中解放出来，让驾驶员有更多的机会从大屏上获取更丰富和详细的信息，就会出现仪表屏幕越来越小的设计尝试。如果未来用户买车都更关注在智能化或自动驾驶能力的方向，那么这可能是一个必然的趋势。因为仪表盘相对独立，主要是驾驶员使用，对整车的用户体验来说比较单一，所以从整车的角度来看，如果驾驶员的能力角色逐渐减弱，那么这一块屏的能力也会逐渐减弱。主持人：对于多屏信息的分布设计，还想深入了解下：多个屏幕之间可以是有一些信息联动，比如说像多屏导航信息的展示、整车氛围联动。多屏互动方式对于L2&3级自动驾驶，有哪些帮助或好处？王絮宁：有用。多屏联动其实也跟不同驾驶角色的权限相关。我们在设计的时候，会觉得多屏联动可能是对不同角色之间的一个操作补偿。但是，我们之前调研过一些用户，不同角色更希望能够做的事情，并不一定是我们觉得让他想做的事情。例如说从驾驶员的角度来说，他特别不希望副驾参与驾驶过程——我们知道，每一个会开车的副驾都会在车主驾驶过程中对他进行非常强烈的干预——所以对于主驾来说，理想中的副驾是什么都不干的副驾；然后对于副驾来说，理想中的副驾是希望自己什么都能做。每个角色对于驾驶这个事情的定义也不一样，如果想从用户体验的角度来对这个屏幕功能进行设计和分配，我们还是要按照场景化的方式，去赋予用户一些功能。当主驾在驾驶中，没有办法去规划一条新路线，那么副驾可以帮他去进行一些辅助操作，例如更快速的路线输入，或者是对于周围推荐点的详细查看，也包括到达目的地附近对停车场的选择等等。如果但从副驾本身的需求来说，就很宽泛，还是得结合具体的使用场景。副驾辅助主驾规划行程是很有必要的，但副驾想指挥主驾驾驶，肯定是不受欢迎的。对于辅助驾驶，也有相关的讨论。当车辆自动驾驶时是否只有主驾能结束？是不是主驾跟副驾有同样的监控责任？这个目前我们没有一个非常明确的结论，可能随着自动驾驶程度的提高，大家的解决方案也会渐渐变得不一样。主持人：分享中有提到自动驾驶心理安全感模型，当时有个观众提问：这个理论模型，如何去渗透到具体的设计？过程中怎么落地？王絮宁：模型提供的是，到底有哪些维度会影响用户去建立安全感，包括认知安全感，包括情感安全感。这些维度是我们在做产品设计时需要去考虑的。那么我们如何去做产品设计呢？这其实又回到了一个比较老套或者是常规的流程——先去做体验地图去发掘每一个用户在不同的场景下，需要跟车辆接触的点，然后去分析这些接触点里我们到底能在哪些方向去展开设计，哪些需要重点设计，哪些不是重点。模型可以提供我们做具体方案设计时候的思路，但你要问具体可以转化为哪些设计，应该怎么做，其实是做不到的，还是需要有一步转化的。主持人：直播中在可预期设计视角部分有个互动思考，渲染界面的视角是路动还是车动？有个观众答复：“感觉目前大部分车都是车辆不动，路在做匹配”。请问絮宁老师您的看法。王絮宁：车不动然后路一直在往前走，是一个比较容易的做法。但是会遇到有一个问题，在某些情况下会跟我们的认知不匹配，特别是泊车类产品，因为我们的车辆是在向后倒的，但是你从屏幕画面上看到的是我们的车不动了，这个车位推到车上面去，这就跟我们的认知方向不匹配，会产生一些理解上的歧义。所以比较好的方式是，我们车路在某些场景下是需要一起动的，在直行巡航场景下车不动路一直在动就可以了，在另外某些场景，我们还需要去不断变换视角，来匹配更适合用户的心理认知。主持人：最后一个问题，人机共驾的核心原则是以人为中心还是以AI为中心？如何考虑并融入到HMI设计中？王絮宁：这个问题有点像一个伦理问题，就是当车遇到某个风险场景时，到底该听谁的？从现有车辆能处理的情况和法律法规来看，肯定是以人为中心的。人机共驾状态，人是主要监管角色，如果车辆的识别出现了问题，但是人没有对此进行接管，主要负责任方还是人。所以我们的核心设计原则都是以人为中心，尽管我们要尽可能的去减少驾驶员的驾驶负荷。那么，如何将这个原则融入到HMI的设计中呢？我们在设计一些用户使用策略的时候，可以去给用户一些预期或者使用倾向。比如说我们在设计变道策略时，我们是更考虑这个变道效率还是更考虑驾驶员的感受？我们是考虑驾驶员在接管过程中可能会遇到问题，还是把一切的责任都交给车辆去判断？这些其实就是我们在HMI中需要去具体考虑的一些设计策略。我今天其实讲的都是比较初级，就是给大家建立一个自动驾驶的基础认知。其实自动驾驶有很多边界性或者是策略性的问题，需要仔细去考虑。它会有一整套的设计的思路，如果大家对更深入的设计思路感兴趣，也许我们后续可以再找机会进行分享。文章的最后，如果对这次分享内容感兴趣的读者可以在知识星球“人机交互设计知识库”中查看相关视频回放以及获取相关文档。人机交互设计知识库主要涉及XR、数字人、普适计算、智能座舱4个大方向，目前已经归档了600多份材料并打了100多个标签，包括各种书单、论文、文档、网页和视频，欢迎对人机交互感兴趣的各位读者加入。#

2022年8月29日

为什么HMI设计需要关注人因学？

二战时期，各种复杂机器和武器装备发展迅速，但是因为人本身生理和心理的局限性存在，导致人很难适应复杂机器的性能要求，从而事故频发。在第二次世界大战期间发生的飞机事故中，90%是由于人为因素而造成的。之后人们在不断的失败中逐渐意识到，只有当武器装备符合使用者的生理、心理特性和能力限度时，才能发挥其高效能，避免事故的发生。人因工程的出发点源于“人的局限性”随着控制论、信息论、系统论、机器行为学的建立，以及人因工程（Human

2022年8月12日

作者招募 | 《建筑师的人工智能参考指南》

在四月份的时候，我曾提及过要和不同领域厉害的人一起出版各领域关于智能相关的书籍，第一本我找到我的好朋友王亚辉博士一起撰写基于人因的智能座舱设计，目前进展顺利；在思索第二本究竟找哪方面题材时我和我的朋友Shadow思考了很久，最后定下来第二本书的课题跟人工智能和建筑有关。为什么是这个方向？因为在未来人工智能将会是建筑师的必修课。我们需要未雨绸缪，着手于人工智能在建筑师群体中的推广，所以我们认为很有必要出版一本建筑AI的中文参考指南。我们坚信人工智能拥有无限的可能性，建筑师拥有无限的创造力，两者结合在一起会迸发很不一样的火花。为了把这本书写好，我和Shadow特意邀请了我们共同朋友郑豪博士作为我们的主编。郑豪博士毕业于宾夕法尼亚大学（University

2022年7月20日

工作七年后的几点感悟

一年一度的自我总结又开始了，今年是我工作的第七个年头，相比去年的关键词“新的对手”、“新的视角”、“新的机会”和“三十而立”，今年的关键词是“走自己的路”、“三本书”、“多方受益”和“分享知识”。走自己的路两年前加入华为的时候，我发现了华为极度不适合我，我清楚地记得我入职第一个月后就跟HR说了我要离开的想法，入职五个月后再次跟HR以及主管提了这事情，而且那天我要去领奖来着。为什么我要用“极度不适合”，简单点说就是我是一个崇尚自由和平等的人，我想不到我为什么要被束缚着；第二是我不想彻底改变我的人格和价值观；最后我认为个人的可持续发展很重要。不得不说，任正非提及的“惶者为王”是我见过最有智慧但又很恐怖的词语，这个词语我真的认为能让人变成一头狼，但是我没什么兴趣，人生的选择有很多啊，为什么要让自己的青春活在惶恐当中呢？没必要吧，这个社会已经够焦虑了，活得像个人不好么？为什么要把自己的全部精力贡献出去？没错，你让公司可持续发展下去，那自己呢？2020年的时候我就定下了目标，一定要在30岁结束前离开华为，尽管晚了9天但也算完成了目标。既然定下了离开的目标，那就应该在这两年里多跟厉害的人多学点东西，尽可能快地提升自己。那么，在这两年里我学到了什么？第一个是很重要的方法论，它可以分为五个步骤，接下来我以我前主管的口吻来描述一下：为什么我们要做个事情？为什么这个事情轮到我们来做？你为什么要做这个事情？做这件事情你的优势是什么？为什么这个事情轮到你来做？其实上述总结一下就是“人无我有，人有我优”，我真的认为这是一句很有智慧的方法论，它能够帮你想清楚你做什么才能比同事和竞品做得更好。如果在座的各位能客观、毫无逻辑漏洞地回答上述问题，我相信你能很清楚地知道自己和团队优点和劣势在哪，但我不建议在座的各位拿这些问题经常灵魂拷问自己和别人。第二个是一位我非常Respect的同事在创新上的分享（为了避免前同事看到这篇文章时有代入感，我觉得很有必要提及一下那位同事是许博）：找到组合中不同部件的优点和缺点，尽可能取长补短，而且是别人没做过的方案。尽管部件和流程的叠加确实能做出创新，但不足够产生合格的发明专利，你只有找到流程和部件中的问题并解决，而且这个方法是原创的，才能做出有技术壁垒的创新。怎么理解原创？那就是学术界和业界都没有的。要做到这一点，你需要不断地研读专利和论文，知道对手在做什么，学术界在研究什么。总的来说，在华为两年真的学到了很多东西，后续我会进一步沉淀我在华为学到的东西并学以致用。在我心里华为是一家值得尊敬的公司，很多人不理解华为为什么能做到中国第一甚至是世界第一，我都会拿两个数据跟他说明：第一是华为有数千位博士；第二是华为2021年在研发上的投入是1427亿，雷军在2022年1月宣布未来5年研发投入预计超1000亿，这也意味着每年平均下来超过200亿。所以为什么华为厉害？因为它可以靠人才、金钱以及强大的方法论帮它做到第一。在离职前我有迷茫过是否提离职，但最后还是选择了离开，理由真的很简单，就跟婚姻一样，如果不合适，何必在一起呢？世界很大，一定要探索并走出一条适合自己的路。三本书今年初我出版了个人第二本书《前瞻交互：从语音、手势设计到多模融合》，第三本书应该会在年底出版。第三本书其实是我第一本写完后最想写的内容：设计+技术，设计师怎么站在计算思维和技术的角度去思考设计，没想到写着写着竟然把怎么做好智能交互设计给总结出来了。这里我大概说一下做好智能交互设计跟传统的交互设计有什么区别：传统的交互设计更多是站在界面布局和流程的角度去设计，这些是看得见摸得着的设计，但智能交互设计是看不见摸不着的，设计师更多需要基于“准确率”和“兜底”两个关键词去思考自己的设计。怎么理解？也就是通过各种手段提升人工智能的准确率并符合用户的意图，所以设计师更多的是设计一个看不见摸不着的状态机。如果对这部分内容感兴趣的读者可以期待一下年底我的第三本书。如果大家要问我为什么急着写完三本书，我可以把我的想法告诉大家：我希望在30岁结束前写完三本别人没写过的书籍，主观来说这对我来说是一个很大的成就，客观来说这件事情好像没多少人做到，它有可能让我更好、更快地可持续发展下去。多方受益我最近发现我好像比较擅长想一下多方受益的事情。为什么要多做多方受益的事情？因为大家都没兴趣做对自己没有利益的事情，只有一个能相互帮助且获取较大利益时才能驱动每个人贡献自己的力量，当每个人的力量聚集在一起时它们有可能发生质的变化。例如去年7月成立的学习小组DESIGNERO仍在健康发展着，组里的成员只要每周贡献一篇论文总结就能获得其余成员的论文总结，这对于跨学科的快速学习有着较大的帮助。目前论文库里已经有了300多篇论文总结，希望明年的这个时候能翻倍。第二个事情是我最近在和不同领域的专家和作者在合著不同方向的智能设计书籍，专家能把自己的经验更多地分享出去并构建自己的影响力，作者和我能从书籍的撰写过程中学习更多的知识，对我来说我能更宏观地知道智能设计在不同领域是什么以及能做什么。当前合作模式已经在智能座舱这个领域顺利地跑通，我也希望能将此模式更好地复制和沿用到不同领域的书籍中。分享知识在和不同领域的专家合作写书时，我对于专家有个诉求就是这名专家需要找到该领域内更多的专家做专业的知识分享，例如在今年的六月和七月份我联合Mixlab的Shadow、王亚辉博士一起邀请了两位智能座舱专家做汽车总布置、仪表盘的分享，这两场的分享时间分别是100分钟和50分钟，而且分享的内容都是基本在外面的行业分享听不到的。为什么要做这个事情？第一我希望我和作者能在这些专业分享上学到东西，这能更好地帮助我们去写书；第二对于分享嘉宾来说我们会联合地对这次分享进行推广，这样分享嘉宾的影响力在一定程度上得到提升，而且核心的分享内容会沉淀在书里被更好的传承下去，基于此分享内容的质量也能得到保证。说到底还是多方受益带来的好处。除了基于直播的知识分享，我也正在做知识星球的事情。在成为设计师的7年内，尤其是写书的4年里，我陆续收集和阅读了不少跟人机交互相关的书籍、论文、文章和网页，可惜没有很认真地做归档。为了能让自己更便捷地获取知识，我决定把以前收集的材料在知识星球内进行整理和标签化，目前已经3个月已经整理了500多条知识和100个标签。为什么用知识星球？因为我希望能有更多的人使用该知识库。但是这个星球是付费的，因为我认为知识库就跟一个产品一样，一个好的商业模式才能让一个产品持续地发展下去，所以收费是必然的。如果对知识星球感兴趣可以使用以下优惠券进行购买。由于前两年在华为不方便写公众号的缘故，导致我的公众号内容基本处于断续更新的状态，离开华为后我打算每个月把我最新的想法和最新掌握的知识沉淀下来，希望能帮助到更多的设计师。主要的分享分为两种：第一是公众号的分享；第二是面向知识星球用户的视频直播，主要是对公众号传播的内容做更有深度的讲解和答疑。举个例子，我在7月初分享了一篇接近一万字关于苹果如何做智能系统的文章，我可能会在7月下旬做相应的视频讲解和答疑。最后，我想聊一下我对于个人可持续发展的一点看法。我觉得要做好个人可持续发展必须满足两点，它们分别是竞争力构建和行业贡献。怎么理解？竞争力构建更多是构建你的独特性，而不是将你的职位提升地有多高，即使你是某大厂P100，当你被毕业后失去大厂P100这个光环后你还剩下什么？最近为什么抖音涌现了一大批高管做“知识分享”和教大家怎么混职场？好问题，我也想知道他们为什么以前不去做分享，现在却扎堆出现。什么是行业贡献？我个人的理解是专业地、持续地输出有价值、有深度、而且能够帮助行业进步（当然这可能是一厢情愿的事情）的知识和经验，而且这些内容能被行业人士认可。当竞争力构建和行业贡献相辅相成后，个人品牌可能帮助你走得更远，这就是我理解的个人可持续发展。成了成为更好的自己，文章的最后我想送给自己和各位读者两句话，分别是蜘蛛侠里的“能力越大，责任越大”，以及张艺兴说过的“越努力，越幸运”。相关推荐六年级交互设计师的几点感悟五年级交互设计师的几点感悟四年级交互设计师的几点感悟三年级交互设计师的几点感悟二年级交互设计师的几点感悟一年级交互设计师的小小感悟在百度实习的一点感悟

2022年7月18日

HCI知识库分享会002：智能座舱数字仪表人因与HMI设计

大家好，最近我在筹备HCI相关的分享，第一期是关于智能座舱人机工程布置，整体效果很不错，第二期的分享我们打算深度聊一下仪表盘。随着人工智能、大数据、智能驾驶等技术的发展，以及车机算力的不断提高，仪表正在成为智能汽车人机交互的重要入口。汽车数字仪表不仅是车内的重要安全信息提示的窗口，同时集成了更多的智能驾驶、多屏联动的功能，正在以更多元的内容显示方式，给消费者带来了多样化的内容呈现和视觉效果。但是，仪表并非不可替代。我们基本上能从特斯拉、理想L9、ID

2022年7月6日

【个人洞察】从WWDC 2020到WWDC 2022，苹果是如何看待和布局“智能系统”的？

为了和Windows、Android产生足够大的差异化，苹果正在从多方面构建一个以用户为中心的操作系统，这些方面包括了智能化、保护隐私、个性化、健康监控和跨设备交互，本篇文章笔者将讲述苹果是如何构建自己的智能系统的。笔者在2020年写过一篇《Design

2022年7月4日

[嘉宾访谈]HCI知识库分享会001：智能座舱开发中的人机交互与人机工程布置

汽车HMI设计师都喜欢关注屏幕上的视觉和交互设计，但屏幕只是座舱交互体验中的其中一小部分，要实现安全、舒适和高效的用户体验，HMI设计师需要多了解汽车总布置的相关知识。为什么？因为汽车总布置所涉及的舒适性、空间、视野、操作和进出方便性、多屏的布置及人因约束对安全、舒适和高效都能产生直接或间接影响。为此，我们在HCI

2022年6月30日

[ 视频回放 ] HCI知识库分享会001：智能座舱开发中的人机交互与人机工程布置

汽车HMI设计师都喜欢关注屏幕上的视觉和交互设计，但屏幕只是座舱交互体验中的其中一小部分，要实现安全、舒适和高效的用户体验，HMI设计师需要多了解汽车总布置的相关知识。为什么？因为汽车总布置所涉及的舒适性、空间、视野、操作和进出方便性、多屏的布置及人因约束对安全、舒适和高效都能产生直接或间接影响。为此，我们在HCI

2022年6月22日

智能座舱语音交互的发展现状和趋势

之前有车企的负责人咨询当前智能座舱语音交互的现状和发展趋势，笔者借此做个简单的总结和归纳，以下内容将分为语音交互的唤醒、聆听、理解、播报4个部分。唤醒声源定位从双音区发展到四音区使用声源定位的目的主要有两个，第一个目的是知道是谁在说话并提供个性化服务，例如副驾说“打开窗户”，这时只有副驾的窗户会被打开；第二个目的是实现定向拾音，由于车内外环境的噪音较大，同时乘客之间的讨论和回声会影响语音交互的拾音质量，因此声源定位能让麦克风阵列锁住某个方向的声音。双音区的意思是将座舱分为左侧和右侧，无法识别是驾驶员还是后排左侧的乘客说话，因此局限性较大。四音区可以将座舱区分为驾驶员、副驾、后排左侧和后排右侧四个区域，能较好地解决双音区的问题。以下是腾讯腾讯AI

2022年5月25日

正在构建的人机交互设计知识库

最近我一直在整理以前收集的资料并一一归档并导入到知识星球上，目前已经归档了348份材料并打了90多个标签，包括各种书单、论文、文档、网页和视频。后续在这个星球中我会持续更新跟HCI相关的资料，尽量让这个知识星球成为一个全面的HCI知识库，让读者对HCI有更深更广的理解。我为什么要做这件事情？主要是人机交互涉及的内容太多，我需要一个地方沉淀和归档我学习过的内容和看过的案例，并且能让我在后续思考时能迅速找到相关资料。第二个原因是人机交互涉及的标签太多，不同标签的组合还能做出不一样的内容，例如几年前已经部分车企用VR设计汽车造型，今年CHI

2022年5月11日

和厉害的人一起做不一样的事情

大家好，最近我终于闲了下来可以写公众号了，因为我已经完成了一个小目标：在30岁前写完三本很不一样的书。第一本是18年出版的跟AI&UX相关的书籍《AI改变设计：人工智能时代的设计师生存手册》，在去年成为一所高校的教材；第二本是今年1月份出版的多模交互设计相关的书籍《前瞻交互：从语音、手势设计到多模融合》，台湾出版社在3月份向我拿了版权；第三本是技术和设计相关的书籍，希望今年底能出版，这本书将从技术的角度讨论多平台、智能该如何设计。步入30岁后，我一直在思考着30岁要做什么？我能怎么把自己的专业能力为设计领域做出更多有价值的事情？思考了很久我决定做以下三件事：1.成立更多的专业学习小组如果大家去年7月有看过《设计师如何做研究和创新》这篇文章，相信大家都知道我运营了一个论文学习小组Designero，这个小组织只有7位成员，从去年7月到现在4月份已经产出了227篇论文总结，几乎能做到每个人每周能产出一篇总结，大家真的很棒。大家可能会问为什么Designero只有7位成员？因为我在小组人数上做了严格的限制，尽管有很多人想参加Designero，但为了方便管理我采用了排队的方式进行人员的管理，只有有人退出了才能有新的人进来。在Designero中，每个人每周都要产出一份1000字的总结，如果这周太忙没有产出也没有关系，发个50元的红包作为惩罚。为什么需要这样的惩罚机制？因为大家都忙，而且其他人写了总结你没写，你可以学习到别人的知识但别人学不到你的知识，这是不公平的，所以用50元作为惩罚机制我认为是合理的。如果两周没有产出总结，那么不好意思你需要离开队伍了，因为后面还有新人想进来。该组织成立到现在，没有任何一位组员超过两周不交总结，而且也只有2位组员因为工作的缘故离开了组织，以及两位新成员的加入。在这个组织里，组员的收获远大于自己的付出，所以大家都会很努力地学习，因此我认为这套督促各位学习的方法得到了很好的验证。我希望后面再成立3个方向的学习小组，它们分别是XR（含多模态交互、触觉、手势等等）、HRI（Human

2022年4月29日

三年后我的第二本书终于要出版了

三年前我出版了人生的第一本书《AI改变设计—人工智能时代的设计师生存手册》，当时就想休息一下开始写我的第二本书，那是一本关于技术和设计的书籍，本来目录都定下来了，后来跟编辑多次讨论后，决定在2020年先把关于多模交互设计相关的内容摆上日程。现在第二本书终于出版了，当我把两本书放在一起拍照，成就感还是蛮强的！我先说下为什么会有《前瞻交互：从语音、手势设计到多模融合》这本书的出现？主要原因有三个：当时的我很想继续把人工智能怎么运用到设计再挖深并分享出来，刚好当时在车企负责整块语音交互的工作并且实现了全国第一个基于语音交互和图像界面深度整合的车载交互系统，我觉得这部分工作内容很应该把相关知识抽象出来分享给感兴趣的设计师。多模交互相关的知识可以通用到VR、AR、空间交互等领域，所以这些知识未来设计师是必须掌握的。当时查了一下国内外工业界并没有多模交互设计相关的书籍，而学术界的论文集却有很多，对于没有研究背景的设计师来说，这些内容会相对难啃，加上AI的发展让多模交互发生了更快的变化，有些内容相对过时了。基于以上原因，我决定用设计师能理解的语言以及自己的实践经验写一本设计师需要且能看懂的多模交互设计书籍。“多亏”了2020年疫情在家办公的原因，我在1月至3月短短的3个月内完成了书稿的70%，后来由于工作上的亿点点忙，最终在9月份写完了剩余的内容。本来想开开心心交稿子，在编辑严格的捶打下，我硬生生地在亿点点忙的工作之余修改了4遍目录结构以及重写了2章内容，最后在2021年3月份正式交稿。交稿后我对这本书已经产生了恐惧，已经不想再看到这本书了，但说实话，整本书内容的饱满度和严谨度有了质的提升，所以衷心感谢我的朋友，郑柳洁编辑。没想到的是这本书原计划在2021年出版结果等到了2022年1月份，当时还有值得高兴的阻力很有可能令这本书3月份才能上市，那就是北京举行冬奥会，但举办期间会让北京附近的工厂暂停工作，那我的书就不能印刷了。在漫长地等待过程中我领悟了一件事情：世事无常，世界并不会跟着你的脚步去走。学会接受这点，人就不会那么烦躁了。还好老天还是眷顾我，让这本书提前印刷完并且赶在春节前上市。越努力，越幸运。其实还有另外一个写书的原因我在上面没有提及，那就是我觉得一个人写一本书不能代表什么，因为还是有比较多的设计师能写第一本书的，但写两本书说不定就不一样了，加上“30岁前”这个标签那就更不一样了，所以我义无反顾地去写书而没有时间更新公众号，所以很想对一直没有取关的读者说句抱歉！但不好意思，更新公众号还要再等等，因为...还是讲讲这本书的内容吧，这本书主要从人工智能、用户体验和技术的角度出发，介绍不同模态之间的差异，然后重点讲解了语音交互设计、手势设计、图形和语音界面融合设计三个方面的知识。如果读者是从事人工智能、语音交互、VR、AR、智能座舱和智能家居的产品经理和设计师，我可以很自信地说这本书能帮到你更清晰地知道未来的科技走向。最后聊一下封面。第二本书的封面参考了James

2022年1月20日

设计师如何做研究和创新

DC将其PDF格式转换成HTML格式，然后使用浏览器自带的翻译工具翻译成中文。建议使用Chrome自带的翻译工具，但需要将HTML文件放入服务器才能将英文翻译成中文。

2021年7月5日

六年级交互设计师的几点感悟

一年一度的自我总结又开始了，今年想说的事情很多，但很多事情不能说而且也不知道怎么说，所以为了写好这一篇年度总结，我看回过往5年的年度总结，看完后感想还是挺多的。今年的感悟我想结合过去的5年总结来谈，今年的关键词是“新的对手”、“新的视角”、“新的机会”和“三十而立”。新的对手去年我加入了华为2012人机交互实验室，随着一年的发展，我们实验室成员在不断增加，在这里我想跟大家说一下我的工作环境：一，我们部门拥有博士学位以上的同事比例在逐渐增加，在我的认知里，这应该是国内企业中，包含设计师在内学历水平最高的团队。二，现在的应届生和实习生综合能力明显优于以往，其中我们正在实习的博士生比例也在逐渐提升。客观来说，能去到一个强大的团队工作是一件好事情，但主观来说，尤其对于自驱力比较强但刚满30岁的我来说，我觉得这些学历远高于我的同事和综合能力较强的后浪们都是我“新的对手”，但对手竟然这么多这有点超出我的预期。之前我一直觉得自己综合能力和天赋还是挺优秀的，只要自己不断努力让自己变得更优秀，在专业能力上超越身边的同事并不是什么难事，现在跟一群博士一起工作，越来越觉得自己正在看《斗破苍穹》小说一样，原来斗皇强者不是战斗力的极限，后面还有斗宗、斗尊甚至斗帝，在现实生活中专业能力究竟有没有天花板？这答案估计是没有的。为什么要把身边的同事当做对手？理由很简单。因为他们很容易激发我的危机感和挑战欲望，同时他们也是我学习和尊重的对象，我希望在华为工作的这段时间里能让自己变得更强。新的视角如果要将“博士”比喻成“斗皇强者”，那么自己如何也成为一名“斗皇强者”？如果现在去读个博士学位，最快也要5年时间才能成为博士（出国读一个硕博连读），这并不是我想走上的道路。如何另辟蹊径成为“斗皇强者”甚至成为一名“斗宗”？我觉得首先要了解博士的特点：博士在学习期间培养出的逻辑思维和解决问题的能力是挺强的，我是否具备这两点我是半信半疑的。半信是因为我觉得自己的逻辑思维都还行，是有上升的空间，但我觉得“逻辑”约等于“理性”，“理性”和“感性”就像一个天平上的两端，越理性意味着感性部分会越来越低，我认为一名只有理性没有感性的设计师是不懂用户、做不好设计的。解决问题的思维我是具备的，但是动手能力我认为欠缺的。虽然我觉得没有必要设定目标成为华为天才少年稚晖君一样的优秀人才，但是具备像他一样的动手能力是必要的，因此以最近我又开始了一年一个项目的计划，这次我会一个人做一个比较有趣的硬件，到时做完会分享出来。所以我认为，如何锻炼自己逻辑能力的同时但不丢失自己感性的部分，快速培养自己软硬件开发的能力是成为一名很另类的设计师的前提，这跟我第二年写的总结里提到的“设计创客”很相似。一位博士有着某个细分领域的优秀专业能力，但有些专业能力不是纯靠学术就能获取的，例如交互设计。交互设计是一个跨学科的专业，我一直觉得交互设计更看重天赋和综合能力，同时熟悉业务和拥有同理心，这些都是要靠实战总结出来的经验，因此设计师不能靠某个细分领域很强就能成为一名优秀的交互设计师。工作了6年的我做过不同类型的项目，在此期间我拥有的不同领域的业务经验是我的优势，但自己在某个细分领域仍不具备很强的专业能力是我的缺点。在看问题的视角上，研究和工程是不一样的。我认为研究最重要的是发现问题，而工程最重要的是解决问题。工程能力可以在工作中实战获得，但研究能力我认为在工作中获取就挺难的，因为绝大部分公司为了快速迭代导致没有时间研究问题，第二是即使别人把问题研究出来了，自己也可以把别人的解决方案模仿甚至“借鉴”过来，第三身边没有可以一起做研究、一起看论文、一起讨论的同事，导致很多企业缺乏做研究的土壤。我国近年来经常被西方国家“卡脖子”，如果我们想获得更持久的进步，如何发现、解决问题是关键。这一年来我有一个很深刻的认识，交互设计师在这么多互联网职业中最应该获得研究能力。为什么？交互设计师算是互联网工作中最轻松的职业，但也是解决问题时最关键的角色，因为他们能直接影响产品效益和用户体验。如果交互设计师们能在设计之余抽空学习如何做研究，无论对于自己还是团队都有着莫大的好处，这也是工作六年后的我最新、最重要的体会。结合1、2、3点，博士有着很不错的系统思维能力，这是需要人通过大量的磨炼才能形成的思维能力。幸好我在大学期间通过各种项目和实战经历获得了较好的系统思维能力，加上写过两本书让我在工作中能更好地系统化整理我的知识，如果精进我的系统思维能力是我未来的目标和成长重点。新的机会我现在做的事情挺有趣的，但由于工作性质的原因，我无法讲述我现在做的项目是有多么有趣，但我可以引用我们的招聘模板，我们人机交互实验室的工作内容主要涵盖智能座舱、跨设备交互、空间交互、情感计算、多模交互等领域，我们的工作目标是提前研究和探索未来3年可能存在的方向并牵引相关技术落地。在工作中如何识别出一个新的机会并推动落地，这是我在华为工作期间需要思考的问题，也是我在华为工作期间获得最大的一笔财富。探索前沿肯定存在失败的可能性，虽然失败乃成功之母，而且我们允许失败，但这不能成为借口，在这里我简单谈一下我的工作心得：识别新的机会需要你有想象力和创造力。我一直觉得我的想象力和创造力挺强的，但无法总结出什么有用的方法论。想象力我觉得属于天赋的其中一种，这个真的因人而异，跟你是小学生还是博士没什么关系，说不定小学生更能异想天开，所以如何超越博士可以从想象力开始。创造力跟想象力和动手能力有关，如果一个人只会光想不懂动手，那就真的只是异想天开，所以为什么我很在意自己一个人做项目，也有一部分原因在这。值不值得动手是一定要思考的问题，因为每个人的时间和精力有限，没必要浪费过多时间在没必要的项目上。在没进华为前，我要做一个项目会这么思考这个问题：第一，这个项目我量力而行就能完成的；第二是这个项目没人做过的；第三是这个项目对自己或者对社会有意义的。进了华为后，我需要思考的问题发生了以下变化：第一，做这个事情对能不能构建技术壁垒？第二，做这个事情如何论证对于用户的价值以及背后的商业价值？第三，我们团队做这事情的优势和劣势在哪？读到这里的读者不要轻视这几十个字的难度，找到这几个问题形成的答案我觉得比写一篇含金量极高的论文还难，因为这些答案能帮你论证出你或者你的项目竞争力在哪。我认为再过1-2年，新的创业风口会再次出现。为什么是未来1-2年？有一部分原因是直觉，但更重要的原因是央行在11年-12年放了一次水，后续我们看到各种创业机会和浪潮；2020年央行又放了一次水，而且今年“十四五”规划已经出来，后续新基建需要各种试错，所以提前做好准备和识别正确的机会我认为是逃离内卷的必要条件。三十而立前两个月我度过了30岁的生日，30岁对于我来说是陌生和紧张的，我真心觉得“三十而立”在我国是一个很可笑的词。之前看过一篇心理学的报道说外国人在30岁左右逐步进入事业的正规，在我国互联网民工30岁就开始焦虑未来即将失业的事情。这现象我认为说明了两个问题：一，我国内卷现象很严重；二，现在大家做的事情同质化严重而且含金量不高，很容易被下一波员工取代。所以如果不想被人卷，就应该自己卷自己，例如构建别人难以取代的能力，同时被别人认可，这样才能构建自己的壁垒和竞争力的。下面我拿自己为例子，希望能给读者带来一些新的启发：刚工作的时候我就建立了公众号，公众号名字就是我的真人名字-薛志荣。其实用自己名字作为公众号品牌是一件很难的事情，因为大家对薛志荣这个人是不感兴趣的，大家感兴趣的是“交互设计”、“体验设计”和“大厂经历”。一开始我纯粹就想分享一些自己的学习和工作心得，所以公众号叫什么我都觉得无所谓，但后面越来越发现一开始走的道路是对的，因为个人品牌对于自己来说才是最重要的，它能成为你的护城河之一，这也是我相比其他博士拥有的优势之一：在他们拼命读书做研究的时候，我拥有了扎实的专业能力的同时也拥有了上万读者的关注量。追求关注量是每一位自媒体的根本诉求，但由于“懒惰”，我对于自己的定位一开始就不是做一名自媒体，我纯粹就是为了分享一些自己高质量的学习和工作心得，这也是我做过正确的选择之一。为什么？如果追求关注量，我应该每天写面试心得、大厂经历，这些是小白用户，也是读者量最大的群体最想看到的内容。由于我对于“用户增长”没有很强烈的诉求，还有我不屑写一些大家都会写的内容，关键是我写公众号的根本目的是为了做好向上管理。什么是向上管理？我写公众号的原因之一是为了让更多的大佬赏识到我，这才是菜鸟能平步青云的途径之一。虽然我现在还没做到，但由于一开始就奔着高质量，跟别人不一样的文章去写，我才逐渐构建了扎实的基础，以及让各个出版社留意到我。本科工作两年半后，清华、北大、邮电、电子工业等出版社陆续联系我写人工智能的书，按正常人的思维来说，这应该拒绝，因为自己能力还不够。为什么我当时快速答应了，主要原因是我“深思熟虑”后得出的结论：第一，写书前我已经写过好几万字的内容，写书算是舒适区外一点点的挑战，并不是很难；第二，当时我看准了人工智能和设计结合的领域，是因为当时人工智能很火，这领域没有相关的书籍；第三，写书前我就读过好几百本书，我知道一本好书大概是什么样，其实就是例子+理论，但不能太深奥，因为太深奥的书卖不出去，所以领域第一本书需要是一本通俗易懂的书，这意味着这本书需要的是广度和深度结合，但广度为主；第四，由于人工智能当时刚起步，市面上看不到更多的相关案例和理论；第五，国内拥有技术背景的设计师很少，能想到写这方面的书的设计师更少，关键是我当时猜到有个人肯定会写，但因为我觉得他写得肯定不怎么样，所以结合以上5点，我脑海里快速得出了一个结论：赶紧写。《AI改变设计》这本书是国内第一本跟人工智能和设计相关的书籍，这是我很早之前就知道的结论，最近看了一下国外亚马逊和Libgen，原来国外第一本相关书籍在2020年出版的，所以我写的书算是业界第一本跟AI&UX相关的书籍。我一直觉得“行业第一本”比“销量第一”这个标签更重要，因为第一本是刻在时间上不会变的，而销量是会随时被其他书籍取代的。最近和前编辑聊了一下，我一直觉得自己写的书销量不怎么样，原来我的书籍销量已经比当年写设计相关书籍的独立作者高了60%左右，听到这个数字我是挺开心的。如果看过我以前内容的读者应该知道我又写了一本书，新写的书是跟多模交互设计相关，这应该是国内第一本跟多模交互设计相关的书籍，因为这本书还在编辑那整理，今年内应该能出版，但不排除中间有其他人出版了相关书籍。这本书是我写过最痛苦的书籍没有之一，因为这本书是一本理论、科普和工具相结合的书籍，我前前后后大改了4次，第一本书我花了300多天完成了书写和出版，而这本书我从2020年初写到了2021年4月份，虽然中间有段时间太忙没写，但这不能成为理由。为什么写第二本书？因为当时就想写这方面的内容，同时我觉得30岁前能写完两本书的设计师几乎没有，所以我就立志在30岁前一定写完两本书，还好完成了。其实能在30岁以前写三本业界第一本的书的设计师在国内应该是没有的，所以我的真实目标是在30岁以前，也就是31岁前写完3本，我第三本书是跟设计&技术相关的内容，希望明年的总结能跟大家聊聊这个话题。工作6年内我平均睡眠时间在6小时左右，期间看过三百本书左右，在前3年我每年都会开发一个应用，虽然中间两年停下来了，最近我又重新捡起来了。以上就是我在业余时间怎么内卷自己，这些经历对我来说是极其宝贵的，希望对读者有所帮助。不过因为这样，也导致我在20岁期间错过了很多东西，例如陪伴家人、谈恋爱、到外面看看等等，这都是我年轻时期最大的遗憾，在新的十年里这些事情我要逐一补回来。同时我对自己有了新的目标，那就是成为一名有责任、对行业甚至社会有贡献的设计师，我要用自己的工作经验和小小的影响力，吸引更多设计师培学会如何做研究；还有利用自己的人脉构建一个新的设计师组织，这个组织的名字叫“DESIGNERO”，也就是我公众号这几年一直使用的头像。“DESIGNERO”这个词源自于漫威的复仇者联盟“The

2021年6月15日

我对交互设计和人机交互的理解

这一年都在做人机交互相关的项目，这些项目和我工作前几年的工作不太一样，所以本篇文章我打算写一下自己对交互设计和人机交互的一些看法，如果读者对这个话题有自己的看法，可以在评论区留言交流。在职业生涯的前4.5年，身为交互设计师的我，主导或者参与过的项目经历从中国市场到海外市场，例如欧美、东南亚以及日本市场；从用户产品到商业产品；DAU从个位数到九位数中间每个数字都有相关的产品经历，包括搜索产品、相机产品、输入法产品、社交产品甚至是游戏也做过；从图形用户界面设计到语音交互设计；从软件设计到软硬件一体的设计也做过，例如投影仪和汽车；从应用设计到系统设计，包括横跨手机、Pad和PC的Windows

2020年11月23日

五年级交互设计师的几点感悟

最近刚毕业的时候听前辈说三年一个小坎，五年一个大坎，今年是我工作的第五个年头，在工作上确实遇到了一个很大的门坎，能不能跨越过去还是一个未知数。去年的关键词是“新的探索”、“一知半解”和“前路迷茫”，今年的关键词是“重新认识自我”、“新的理解”和“重新出发”。重新认识自我做交互设计师的好处是轻松，只要你逻辑够强，画稿够快，沟通能力还不错，你一天的工作不会花你太多时间。当时选择交互设计师这个职业也是考虑到这一点，在工作前四年我每一天能有不少的时间掌握新的知识，所以我觉得我的成长速度没有慢下来。但是，前阵子跳槽到华为后，我的工作和学习平衡发生了很大的变化。为什么跳槽到华为？因为华为在国内刚组建了一个HMI

2020年7月29日

Design for Intelligence in WWDC 2020 讲了什么？

对于很多人来说，手机设备已成为我们生活中的重要组成部分。我们每天都要打开手机执行各种任务，例如通讯，订购食物，甚至跟踪我们的饮水量。6月底刚结束的WWDC

2020年7月6日

实现多模交互融合的四个阶段

多模交互融合是普适计算和自然交互中最重要的组成部分。笔者认为，实现完整的多模交互融合需要分成四个阶段，分别为独立工作阶段、初步融合阶段、语义理解阶段和任务自适应阶段。01独立工作阶段各自工作阶段的意思是多个模态可以正常、独立地工作，但各个模态没有融合在一起。之前笔者写过一篇《什么是多模交互？》，里面介绍了每个模态的基本现状，在这里我就不重复介绍了。触控、语言仍然是现阶段人机交互中最常用的交互方式，例如GUI和VUI。手势识别在2019年有了新的突破，Google的科学家们研究出一种新的计算机视觉方法，用于实现手部感知。该方案能够在实机实验中仅凭一帧图像识别出一只手（或者多只手）上的21个3D点位，而且能在手机上就能进行实时追踪，并且还能同时追踪多只手，可识别遮挡。但有些时候玩着玩着，屏幕也会突然“放空”，只能看到手，识别不出手势。为了避免全部手势识别都依赖于计算机视觉技术，Google还设计了一款名叫Soli的微型雷达芯片，它首次应用于Pixel

2020年4月26日

AI如何影响智能交互

Flight结合了过去一年所有航空公司的飞行记录，以及该用户的出行习惯，通过AI帮助用户预测几时是购买机票的最佳时间，这样用户就不用反复查询机票价格，如果AI输出的结果不及预期，Google

2020年3月23日

VGUI融合的三种实现方式

一般来说，多模交互中的VGUI（VUI+GUI的简称）有三种实现方式，分别是应用级语音交互、可见即可说和系统级语音交互，真正对多模交互有用的实现方式是系统级语音交互，以下我会介绍三种实现方式的区别。01应用级语音交互应用级语音交互的意思是，当语音交互发生时，系统会调起一个语音应用遮盖当前界面，用户只能对语音应用进行操作或者退出语音应用，语音应用和其他应用都是互斥的。以iPhone上的Siri为例，Siri是一个信息中枢系统，它会把系统和第三方应用里所有的语音技能和需要的信息都集成在自己的应用里，用户需要使用Siri的话就必须暂停操作当前应用。应用级语音交互不需要知道当前发生了什么，这也是它的第一个特点：应用级语音交互会脱离当前应用和场景。应用级语音交互的前生是独立的语音操作系统，也被定义为语音助手，例如苹果的Siri、亚马逊智能音箱Echo上的Alexa和Google

2020年2月27日

影响人工智能发展的五大要素

相信大家都听说过2016年李世石和AlphaGo的人机大战，但还有多少人关注了去年12月李世石退役前和韩国围棋AI“韩豆”的人机大战？经历了2017、2018高歌猛进的两年后，相比2018年，2019年中国人工智能企业融资金额下降幅度高达34%，融资数量下降幅度高达40%。去年绝大部分的人工智能公司都不好过，头部企业在上市途中遇阻，小公司生存艰难，裁员消息络绎不绝。为什么？因为以深度学习为代表的人工智能并没有人们想象得那么全能，在发展过程中人工智能遇到了难以突破的瓶颈，局限人工智能的发展我认为有五个因素：算法、数据、算力、伦理/法律和商业化。算力永无止境的算力需求2012年，谷歌的科学家们将16000个CPU联接起来，建造了一个超大规模的深度学习神经网络—“谷歌大脑”。在研究人员没有给此机器灌输任何关于猫的形态信息的前提下，“谷歌大脑”通过1000多万个YouTube视频缩略图中随机抽取的20000张图片，自己构建了一个模糊的猫的概念。2016年3月，谷歌的AlphaGo战胜了韩国棋手李世石时，人们慨叹人工智能的强大。但大家可能不知道，2015年10月的分散式运算版本AlphaGo使用了1202块CPU以及176块GPU。相比云计算和大数据等应用，人工智能对计算力的需求几乎永无止境。根据OpenAI在2018年的分析，近年来人工智能训练任务所需求的算力每

2020年1月15日

什么是多模交互？

近年来比较热门的物联网可以认为是普适计算的雏形，多个小型、便宜的互联网设备广泛分布在日常生活的各个场所中，通过相互连接的方式服务用户。计算机设备将不只依赖命令行、图形界面进行人机交互，可以用更自然、更隐形的方式与用户交互，这样的用户界面被称为“自然用户界面”(Natural

2019年12月30日

多模交互设计时该注意哪些事项？

最近一年都在探索多模交互相关的知识，今天把思考的内容整理出来分享给大家:-)多模态交互相关1.操作对象应支持一种或多种交互方式。每种交互方式都具备“目标选中”和“目标执行”两个属性。系统或应用级别的操作型控件应考虑一种或多种交互方式。如果当前GUI界面中，不同控件的交互方式尽量保持统一，若存在差异，建议显性说明。语音交互可以由用户或系统自主发起。不同类型的操作控件应有不同的语音交互意图和流程来支持。2.多模态交互过程中，同时考虑操作对象和流程颗粒度的变化和返回逻辑，建议统一以一个用户界面（User

2019年11月21日

设计师能利用AI做什么？

前阵子在京东做了一场分享，分享的标题是《设计师能利用AI做什么？》。今天把分享内容分享给大家。如果说大部分设计师的产出都和图形有关，例如图片编辑、插画、交互稿、视觉稿、那么AI能不能完成以上内容呢？我先举些例子：2016年日本的早稻田大学公开了一项自动描线的技术，这项技术能够自动识别图像并确定图像的具体轮廓，然后完成描线的工作。即便是衣物线条很复杂的草稿也可以完美地转化成线稿。这项技术在后面的介绍中有一款免费产品可以体验到。我还记得2016年图片编辑软件Prisma风靡了全世界，那么，去年一款名叫FastPhotoStyle的工具更为惊艳。FastPhotoStyle是英伟达发布的一款开源图片风格转换工具，它能把照片变为各种艺术风格。只要给出风格照片和目标照片，那么FastPhotoStyle就能将风格照片上的风格特点迁移到目标照片上，图上的效果简直是以假乱真。去年，有一个名叫Crypko的区块链游戏震撼了整个二次元圈，这游戏的玩法跟以前流行的“以太猫”类似，就是利用GAN，生成式对抗网络将两张不同风格的插画融合成一张新的插画作品。用户可以通过租赁或者购买的方式获取插画后，然后和自己的插画进行融合，生成新的插画。质量好的插画具备较高的收藏和观赏价值，例如上图中的插画租赁价为7以太币，2018年10月一个以太币约为1000元人民币。由AI创作的油画作品《埃德蒙·贝拉米画像》在世界著名艺术品拍卖行上拍出了43.25万美元的价格。该作者还创造了整个贝拉米家族，以下是埃德蒙·贝拉米的曾祖父和曾祖母。好了，看了这么多案例，现在的AI究竟是什么？其实，以前也有各种AI技术，它们更多是基于统计学去实现的，它们通过算法获来预判事件或者取事件的准确率。现在的AI在本质上和前者没有什么区别，其实都是一种预测能力。简单点说，以前的AI是主要是分类、聚类、回归、决策树等等统计方法，例如垃圾邮件处理、文章自动分类都是用了以上的方法。现在的AI更多是一种名叫深度学习的方法。我们可以认为深度学习是一个黑盒子，只要我们输入数据，它就能在一个多层的神经网络里自动训练，找到相关特征后形成模型，然后再将结果输出出来。既然我们把深度神经网络当做黑盒子，那么我们就不要在意黑盒子里的是什么，只要我们寻找准确率高的深度学习模型就好了。现在有哪些现成的AI资源可供我们使用呢？对很多没有绘画经验的人来说，绘画是非常困难的，更困难的是为绘画选择和谐的色彩，即使是相似的颜色，其中的差异也会对绘画结果产生巨大的影响。在漫画线稿上色AI这个领域，PaintsChainer几乎可以算是标杆。PaintsChainer操作非常简单，用户选好线稿上传，自行选择颜色并涂在相应区域，PaintsChainer会根据图像和提示的颜色实时自动为新图像上色。PaintsChainer还有自动提取草图里线稿的功能，大家可以尝试一下。BigJPG是一个很神奇的免费网站，它能将图片清晰度放到2-16倍。左侧这小图是我在网上随便找的图片，分辨率只有200*254像素，放大4倍后就是第二张图的效果，非常模糊。使用了BigJPG后整体的线条变得非常清晰，它的线条甚至比原图还清晰。整张插画可以直接使用。相信大家都听过这个笑话，我们如何画一匹马呢？首先我们画两个圆，再画几笔，在脸上画几笔，再画上鬃毛和尾巴就完成一幅栩栩如生的作品了。在以前，这可能是一个笑话，但现在，这肯定是一件很正常的事情。这8张图如果是由一名设计师来画，大概要画多久？有谁能给个答案？如果是我，我是不会去画的，说实话估计我一个月也画不出来，因为我没什么耐心长时间画一幅画，而且对光线处理等完全不熟悉。大家有没有发现这几张图里有几张图是类似的？大家可以观看一下，其实5和6以及4和8的布局是一样的，那么它们是怎么生成的呢？以上这个是英伟达最新的发明：GauGan，它能通过几笔就能自动生成一张“风景照片”。这个就是我今天花了20秒画的图，它十几秒内给我生成了右侧这张图片。如果以后没有风景素材，不妨可以考虑一下这个网站。以上这个是借鉴了小米官网的案例，6种天空滤镜内置于你的相册滤镜中，一键换天。人物照片是我们常用素材之一，肖像权和版权成为我们最烦恼的问题之一。generated.photos也是一款免费产品，它号称通过AI技术自动生成10万张肖像照片。这个网站拥有不同种族、年龄、皮肤、性别、眼睛、心情等数据，可以通过排列组合的形式创造出10万张肖像照片，这些照片里的人物在现实生活中都是不存在的，所以不存在肖像权问题。

2019年10月28日

四年级交互设计师的几点感悟

又一年过去了，从大学毕业到步入职场成为一名交互设计师已经四年多了，有些时候我真心觉得四年光阴一下子就没了。回望过去，这四年里我究竟做了什么？我有成长么？我又得到了什么？设计师这条道路我还能走多远？第四年给了我答案，今年最主要的关键词是“开花结果”、“新的探索”、“一知半解”和“前路迷茫”。开花结果今年二月份北京百度的同事问我要不要回去做两场关于AI设计的分享（这里要再次感谢莉莉、腾飞以及百度BIT学院给予的机会），当时完全没想到我是提完离职再回去北京做分享的，所以四月份写PPT时我有点难过，因为后面很可能没机会见到大家了；但我又告诉自己，这是我在百度四年来最重要也是最后一份答卷了，我一定要好好完成。在北京出差的两天里，我做了6小时的分享以及和各位同事一一做了道别。所以“开花结果”这词对我来说意味着百度这段路，我走完了。虽然四年里充满了酸甜苦辣，但这段路我没有白走，因为我对设计的理解加深了；我的业务能力提高了；我在业余时间自学了很多新知识，还写了一本跟AI设计相关的书；在业界算是构建了一点点影响力，也认识了很多很厉害的大牛；最后跳槽也还不错，薪资是毕业时的好几倍。总的来说，虽然在百度做了四年螺丝钉，但还好我的成长没有慢下来。如果还想要下一次的开花结果，我仍需要不断地努力。新的探索最近我跳槽到新势力车企探索AI相关的设计，目的很简单，就是尝试新的设计方向。我觉得汽车设计非常复杂，因为你不仅要考虑GUI的设计，还要考虑多通道的设计，例如视觉、听觉和触觉三个通道的同步和异步交互。同时，汽车拥有很多传感设备，它能实时收集环境和用户信息然后给予用户反馈，这时候你可以考虑更多关于多模交互和AI设计的场景，两者可以在汽车设计上得到充分的探索。除了软件层面，在汽车内做设计还要考虑空间设计以及整合设计，最近和汽车造型设计师深入探讨了一下，每一个汽车内饰造型的背后可能存在着上千设计稿的打磨，不仅要考虑考虑风格的定义，还要考虑屏幕在不同环境下的反光程度、司机最佳的注视角度，同时还要考虑如何把各种设备塞进车里，从而不影响用户的坐姿和开车习惯以及把自己的设计尽可能地被还原。造型设计不只是和图纸打交道，还要考虑各种材料和工程问题，也是挺不容易的。总的来说，我认为汽车设计比互联网的设计更有意义，更有使命感，因为你的设计有可能会拯救一条生命。同时很多汽车HMI（Human

2019年9月23日

零基础的你也能一分钟成为人工智能实践高手

人工智能超强的智能能力对于创作者来说是一个非常棒的工具，但是将人工智能集成到自己的工作流程中对于那些不会编写代码的人来说是一个很大的挑战。相信大家多多少少看过一些人工智能相关的文章，里面全是这种图：说句实在的，看到这些图的第一想法就是看不懂第二想法就是关掉网页所以这篇文章到底讲了什么东西？如果能耐心看完文章打算去实践的，当尝试安装开发环境时发现一大堆东西搞不懂，最终就是以下表情：相信很多设计师都止步于此，想尝试人工智能的黑科技却不知道如何实践。今天我给大家看一下我昨天的实践结果。物体识别空间深度检测（没错，这是我的自拍）图片转变成线稿图像风格转移没错，这些实践结果都是昨天得到的，而且是在5分钟得到的产物，当然不是通过P图的方式，而是通过一款神器，它的名字叫Runway

2019年8月23日