查看原文
其他

Notion的AI实践:如何在产品中集成AI,打造让用户信任的AI体验?

Founder Park Founder Park 2023-12-30
作为一款笔记类产品,Notion 是比较早将 AI 和自己的落地场景进行结合的产品之一,并且取得了不错的市场反馈。

Notion AI 测试版于今年 2 月份上线,费用为 10 美元/月,3 月份就有消息称 AI 功能为 Notion 额外带来 1000-3000 万美元的 ARR 年度收入。4 月份,Notion 对外宣传 Notion AI 用户突破 400 万。

在功能迭代上,2 月份上线时推出了 Autofill(自动填充)功能,11 月份,上线了最新的 Q&A 功能,提供一键搜索功能,快速搜索用户在 Notion 里的信息。

Notion 最近在官方博客上分享了他们将 AI 集成 Notion 中的思考和策略,以及如何在 AI 工作流中更好控制用户行为和预期(Humans in the Loop),可以让我们一窥 Notion 对于 AI 的判断和深度思考。

文章转载自「Notion 中文社区」、「下维 NextDimension」,Founder Park 进行了整合和部分增删。


01

Notion AI 背后的关键决策

本章节作者为 Notion 联合创始人&CEO Ivan Zhao,发布时间 2023 年 11 月 30 日。

现在,数百万用户已经采用 Notion 的 AI Writer 和 AI Autofill 来总结内容、头脑风暴、草拟初稿、进行翻译,以及改进写作和语法(这是我最喜欢的功能)。就在两周前,Notion 推出了 Q&A——这是一个新的 Notion AI 产品,可以帮助你使用工作空间中的信息来回答你的问题。

回顾起来,那几个月我们为 Notion AI 在私人 alpha 版本中的发布付出了努力,这些经历对我们未来如何处理 AI 具有基础性的影响。以下是最关键的时刻和决定。


我们对早期的 AI 并无惊奇。然后,一切都改变了。

2019 年,Simon 和团队去 OpenAI 的办公室参观,参加了 GPT-3 的演示。这大约是在 GPT-3 在 2020 年 6 月发布的一年前。他们问模型:「为什么科罗拉多州有这么多的花栗鼠?」它给出了一个完全虚构的答案,技术的限制很明显。

我还记得曾经试玩过早期的 GPT-3 游乐场,我觉得这很有趣…… 同时也在想,除了产出一大堆低质量的内容,别人会用它来做些什么。但仍然,有一个鸿沟。它还没有足够聪明。

在接下来的几个月里,Simon 密切关注 AI 领域。DALL-E 的发布是第一个真正引起他注意的大事。在 2021 年初,他开始创造一些让人觉得惊喜的图像,并在 Slack 上与我们所有人分享。我们感觉我们处在比以往看到的更强大的模型的时间节点。

Simon 的 DALL-E 艺术作品,"Mini Tokyo"

Simon 的 DALL-E 艺术作品,"might be nice to live here"

在 2022 年秋季,我们提前获得了 GPT-4 的使用权。然后我们意识到 AI 可能变成什么。

这个模型变得更加聪明。在此之前,大多数 AI 的表现就像自动完成一样,基本上就是文本的再生。当我第一次使用 GPT-4 时我想:哇,这东西真的可以「思考」。

在那一刻,我们明白 AI 可以帮助我们实现 Notion 的使命:使软件工具制作普遍化。我们建立 Notion 的很大一部分原因源于计算机先驱 Doug Engelbart 在 1962 年的论文 Augmenting Human Intellect: A Conceptual Framework。Engelbart 认为计算机是有能力帮助我们解决问题的机器,而不是当时的房间大小的计算器。

我们知道 AI 会是这个方向的一步——人们将能更好地塑造计算机以满足他们的需求,并增强他们的思维,从他们的工具中获得更多的成果。包括 Notion 在内。


Notion AI 的基础形态是在一个酒店房间定下的

AI 技术正在快速改变,GPT-4 的演示向我们展示了 AI 如何(并将会)改进。已经有 AI 工具出现了。过去市场上已经有了一些 AI 工具,在未来将会有越来越多的公司将 AI 融入到自己的产品中。

Simon 和我有两个坚定的共识:AI 将为我们的用户带来极大的价值,而我们将成为率先将 AI 融入产品的先锋。

我们也有许多不知道的事情:我们到底会把 AI 用到哪里,我们将如何做到这一点,以及什么样的 UI 才能达到我们的目标等等。

这些问题的答案,在一次公司全体成员的外出团建活动中逐渐变得清晰。

回想起来,那真的是创造 AI 原型的理想时刻。全球的团队成员聚集在一起,能够更加专注于创作(来自 Slack 的干扰极少)。这周的大部分时间我们都在酒店房间里与产品和工程团队的一些成员一起投入到这个项目中。

我坐在一边的沙发上,Simon 坐在另一边的沙发上,一起熬夜工作。我们额外又多留了三天,以便完成整体的原型设计,几乎每顿饭都在同一家餐馆吃 tacos。这个情景与 2015 年 Notion 在京都的艰难岁月如出一辙,在那里我们挽救了濒临崩溃的公司,每天穿着睡衣编程,彻底重塑了产品。曾经的那种全身心投入、沉浸在创作中的感觉再次涌现。

直到这次团建活动结束时,Notion AI 的原型已经完成,并在这个过程中对产品做出了几个重要的决策。

  • 我们需要为AI Writing 创建一个全新的UI

鉴于当前的 AI 技术和我们的产品用例,从写作工具开始是最合理的。但当时还没有好的、互动式的写作界面。大多数用户界面就像填写表单一样生成内容(内容需要复制粘贴到其他地方使用)。我们的目标完全不同, 是将 AI 以一种自然的方式融入 Notion。

  • 平衡预制 Prompt 与更通用文本输入的使用

类似于开箱即用的 Notion 模板,我们想使用预制提示为用户提供一个更容易理解和使用 AI 的入口。目前,「改善写作」是 Notion AI 中最常用的功能。但我们也想给人们一种方式,通过 Prompt 让 AI 做特定的事情,从而让他们根据需要塑造 AI。最终,我们给两种不同使用体验相同的权重。

  • 如何访问AI

我们已经有了「/」命令,可以在 Notion 中做几乎所有事情。有一个讨论是要不要将这个作为 AI 的入口?最终,我们决定使用空格键创建一个新的入口,这需要用户打破一些习惯(早期得到的反馈是这不够直观)。尽管如此,我们坚信交互体验必须简单且易于访问。

  • 将AI设为选择打开还是默认开启(被动 or 主动开启)

经过一些内部讨论,我们决定默认开启 AI。Simon 和我都坚信,我们不希望产品分化,造成一个有 AI 和一个没有 AI 的 Notion 版本。但如果用户使用企业版,可以选择关闭 AI。

  • 其他值得探索的用户案例

我们知道用户在 Notion 中储存了宝贵的信息,AI 可以提供一种更快更容易访问这些信息的方式。在此期间我们首先开始探索问答功能,以及全局搜索栏。

这就是我们将想法转化成原型并融入产品的全过程,不到一个月后,我们就在个人账号的 alpha 版本中发布了 Notion AI。


面向新一代的 UI 设计

我们对构建 AI 写作的 UI 几乎一无所知。因此,我们开始从头学习。从分析现有的 AI 工具的 UI,收集灵感,到利用我们自己的产品设计经验。我们正在寻找让使用 AI 更自然、更有趣的方法。

我们最初的 realUI 的原型是在创新工作坊的最后一天创建的。我们用竹签牌画出了设计图,然后我们用 iPhone 拍了照片。

最终,我们的目标是创造一个包括有各种各样的能力的 AI 的可层叠界面。总体来看,与其说我们正在构建一个 UI,不如说我们正在通过这个 UI 来让用户访问一个全新的维度的工具箱。而且,AI 不仅仅是一种增强功能。它也是一种全新的设计原则。我们相信,AI 图灵测试的真正突破还只是表面。AI 有可能会重新定义我们与软件和我们的工具的关系。


02

Notion 如何打造让用户信任的 AI 体验

本章节作者为 Notion AI 研究专家 Notion Jose M. Ceballos,发表时间 2023 年 10 月 20 日。

是否信任 AI 是一个很复杂的问题,因为信任往往意味着很多东西。

当大多数人思考这个问题时,首先会考虑到数据安全问题。然而,生成式 AI(GenAI)的出现带来了一系列全新的信任挑战,这不仅影响到开发者,也影响到使用 AI 产品的用户。当你向 GenAI 模型发送提示(Prompt)时,你实际上是将决策权委托给了一种与过往所有软件都截然不同的系统。考虑到这些生成模型内部的随机性,你能否相信它能做出正确的决定,并且持续保持可靠性呢?而「正确的事情」究竟意味着什么?

在 Notion,我们致力于开发既简单易用又实用的 AI 工具,同时确保其准确性和可信度。为了达到这种平衡,一种方法是确保用户能适当地参与并了解 AI 的分析过程。

我们将这称为:keep the humans in the loop(使人类在工作流之中,KHITL)。


GenAI 的生成能力就像一把双刃剑

作为一名认知神经科学博士、用户研究员,我的博士研究专注于强化学习,即大脑如何利用环境反馈来学习和做出决策。这些天,我也在思考如何将这一过程如何应用于 AI。

到目前为止,几乎所有计算机软件都表现出确定性行为——即每次都精确执行其编程任务。即使早期的消费级 AI 模型也被设计为高精度预测,并能够提供用户期望的结果。

用户提出一个问题,早期的 AI 会综合各种信息给出一个确定性的反馈。

然而,GenAI 的做法则截然不同。当今的大语言模型(LLMs)是在包含数十亿网页的数据集上训练出来的,通过分析这些巨大数据集中的词汇共现(co-occurrence)来基于复杂的概率分布生成文本。与简单的自动补全系统不同,GenAI 模型有时会选择分布中的其他选项,为它们的响应带来创造性的不可预测性——这种「生成能力」创造了全新的内容。

同一个问题向大模型提问很多次,可能会得到很多个不同的回答

这种变化性既是特色也是缺陷,当然它也是 GenAI 出众的语言能力的源泉。当你与这些新模型交谈时,感觉很像在与一个人对话。但如果你反复询问同一个问题,往往会得到完全不同的回答。

正是这种变化性让整个过程变得更加引人入胜。


相关的上下文内容对我们理解信息十分重要

想象一下,你给 GenAI 模型一个这样的提示:「我们新产品发布后面对的主要批评是什么?」但没有任何一个 AI 能完全回答这个问题。你可能会提供一些用户反馈、应用商店评论和支持票据的片段,让 AI 综合这些信息源,形成一个高质量的答案。

你可能会问,「高质量的答案是什么意思?是指正确的答案吗?还是仅仅是听起来连贯的答案?我该如何区分二者?」事实上,如果没有上下文,这是做不到的。

当你在现实生活中向某人提问时,你的大脑会考虑许多因素来评估其回答。你对这个人了解多少?他们可能会带着什么偏见来谈论这个话题?当你浏览网页时,也会经历同样的分析过程。这个页面是谁写的?它和今天的相关性如何?我们人类会使用这些辅助信号(大多数时候是自动的,而非刻意训练的)来判断新信息的可靠性

但对于 GenAI 来说,这是一项艰巨的任务。早期的大语言模型读取提示并做出回应,但它们像黑箱一样不透明。你无法知道模型是如何分析你的问题的,而且大多数情况下,你也不清楚内置随机性在多大程度上影响了答案。

我认为,实现真正的人类-AI协同的关键在于创建一个能够理解我们情境学习和决策过程的工具。保持人类参与到工作流中的意思是:当我们在使用 AI 时,能够理解 AI 的所作所为,并对模型代表我们采取的行动能够及时提出意见和反馈。


能够让用户有掌控感会增加我们对工具的信任感

在 Notion AI 中,我们尝试在预先构建的功能(即开箱即用)和用户自定义 AI 输出(满足个性化需求)之间找到平衡。不论使用哪种工具,Notion 用户和所有知识工作者大部分时间都花在生成、修改或查找信息上。在这些不同的互动类型中,保持人类参与的意义各不相同。

在生成信息时,你可以让 AI 帮你撰写整个草稿。或者你也可以在写作的每个阶段与 AI 进行合作,从头脑风暴、构思大纲到撰写草稿。在这种情况下,每个步骤的结果都会成为下一个步骤的输入。

如果你对答案不满意,可以随时修改 prompt,得到一个新的答案。

在修改已有文档时,AI 可以处理整个文档,也可以只针对你指定的特定内容块进行操作。在这里,AI 能够以几乎无限的方式根据你的偏好来修改你的内容。

在查找信息时,你可以让 Notion AI 从会议记录中提取行动项目等内容。但你也可以要求它深入分析文本并提炼出新的洞察,这既包含了查找信息也展现出了生成能力。

AI 与内容互动的方式有无数的细微差别,AI 技术专家需要回答关于如何保持人类参与工作流的无数问题。我们应该在哪些时候、以何种方式让用户参与每种类型的 AI 互动?我们如何通过平衡用户驱动和 AI 驱动的行为来构建协作体验?我们如何调整这些方法以满足 Notion 用户的独特需求和使用案例?例如,一名大学生回顾 AI 对讲座笔记的总结可能与销售总监根据机密客户数据生成报告的 AI 信任需求大不相同。

每个场景都会带来独特的问题——我们的产品必须足够灵活,以适应这些问题。


AI 的未来必须在信任和效率之间找到平衡

随着我们将 AI 更深层次地融入 Notion,提供值得信赖的用户体验的这些解决方案将成为我们的关键。例如,你正在准备一个基于近期客户电话反馈记录的 PPT。在 Notion 中,仅需点击一次,AI 就能为你概括每次通话内容--这是我们产品今天已有的一个预设功能。

但想象一下,如果模型可以把这个过程分解成一系列步骤,如首先在记录中找到客户的痛点,然后是客户的赞誉,再把这些笔记转化为市场洞察和产品建议,情况会怎样?

GAI 会考虑多个信息来源,针对你的 prompt 生成回应

它甚至可以在关键点暂停,让你有机会在这些信息成为下一步输入前,批准、拒绝或修改当前的输出:

  • 这是我对你的指示的理解…

  • 我提取了这些关键的客户反馈…

  • 这是我的洞察总结…

结果的差异将是显著的:从一个普通的摘要到根据你的具体需求定制的上下文相关内容。由于你能够在整个过程中与AI合作,这种体验似乎更符合我们大脑处理和评估信息的自然方式。

如果可以通过选择模型使用的信息源来指导它进行回应,那会怎么样呢?

然而,另一方面,过度参与工作流循环也可能带来问题。任何基于 AI 互动的工作流程都包括很多环节,其中 AI 需要定位数据源、分析数据、得出结论、做出决策,并采取行动。如果过多地展现这些过程,可能会导致用户体验变得不那么友好。如果你在每个阶段都需要检查 AI 模型,那么自己完成工作可能会更快。

我们才开始理解并应对 GenAI 带来的这种新型挑战。随着技术的进步和我们对用户偏好的深入了解,我们将确保 Notion AI 继续注重用户信任。通过我们产品的每一次迭代、每一个客户电话、每一次调查反馈,我们将逐步靠近实现人工智能与人类协同的愿景。



如果你关注大模型领域,欢迎扫码加入我们的大模型交流群,来一起探讨大模型时代的共识和认知,跟上大模型时代的这股浪潮。



更多阅读
王小川创业 8 个月:大模型还没到谈 PMF 的时候
OpenAI 官方 Prompt 工程指南:写好 Prompt 的六个策略
创业者应该如何拥抱AGI:尽早下场、CEO亲自抓、让3.5%的人先参与
AI Pin、Meta AI、Snap 眼镜,AI 可穿戴设备的风又要吹起来了?
估值超5亿美元,体验碾压Bard、Bing,AI搜索引擎Perplexity的想象力在哪里?
Meta、Midjourney、Adobe、DALL·E:四大巨头的 AI 绘图模型综合评测

转载原创文章请添加微信:geekparker
继续滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存