GitHub首席工程师:别再逼着用户跟AI聊天了!
作者 Amelia Wattenberger 是 GitHub 的首席研究工程师,她是 GitHub 实验项目 GitHub Next 的核心成员之一,参与开发了 GitHub Copilot 的诸多功能。她的自我介绍是「生活在 Web 开发、设计和数据可视化的交汇处。」
对话没有预设用途
用户不知道它能做什么
提示太难写了
它可以变成 UI 的一部分吗?
LLM 太简单了:我们把文本发送给它们,它们就会返回文本。
你是谁:我想让你充当解梦师。 你应该如何回复:我将向你描述我的梦,你根据梦中出现的符号和主题提供解释。 你不应该如何回复:不要提供关于做梦人的个人意见或假设。 你应该如何回复 :只需要根据给定的信息提供事实解释。 我们应该如何开始:我的第一个梦是被一只巨型蜘蛛追赶。
我正在研究一种辅助用户写作的 AI 界面。像一位优秀的写作导师一样,它会在需要改进的内容方面提供一些建议,例如「让这个过渡更流畅」或「在这里添加一些具体的例子」。
滚来滚去
累死了
我一直认为瓦尔登湖是一个做生意的好地方,不仅仅是因为靠近铁路和冰贸易;它还提供了其他可能不透露出来的优势;它是一个优良港口,有不错的基础。没有涅瓦沼泽需要填平;尽管必须在每个地方自己打桩。据说洪水、西风和涅瓦河的冰会将圣彼得堡从地球表面扫除。
我相信瓦尔登湖为商业提供了一个充满前景的机会,不仅因为它靠近铁路和冰贸易,还因为其他未公开的优势。它拥有优良的港口设施和坚实的基础,无需像涅瓦河沼泽那样进行广泛的沼泽填充。然而,我们应该谨慎对待所有独特的好处。值得注意的是,圣彼得堡也面临着被洪水、西风和涅瓦河的冰摧毁的风险。
我将瓦尔登湖视为一个非常出色的商业目的地,不仅因为它靠近铁路和冰贸易,还因为它提供了其他未显现的优势。它拥有出色的港口设施和坚实的基础,无需像涅瓦河沼泽那样进行广泛的沼泽填充。但是,必须谨慎地揭示这些得天独厚的优势。此外,也不得不认清圣彼得堡面临的危险:洪水、西风和涅瓦河的冰可能会使这座城市消失。
问一个问题等半天
创作的 flow 都没了
以画家作画作为例子。画家会有两个动作:
把工具交给人
让用户发挥价值
作者观点评价
「好的工具会清楚地告诉我们如何使用它」,我觉得这句话很奇怪,编程语言很少对如何使用它们有意见。例如,我想「取消我的订阅」,我的下标被取消就可以了,我不需要弄清楚子菜单中的哪个子菜单具有神奇的「结束订阅」按钮。 如果认为 ChatGPT 是一个「先知」的话,那态度就已经错了。它是一个工具,如果都不知道如何使用这个工具,就不要再抱怨不喜欢它了。如果连如何使用工具都不知道,那产生垃圾结果是必然的事情。 我认为像 ChatGPT 这样的界面引人注目的首要特质就是:你不需要知道如何使用它,只需使用你已经充分掌握的人类语言。如果你不明白它说的话,让它解释一下就可以。从本质上讲,它使预设用途功能过时了。 这不是一个很有说服力的论点,Copilot for Docs 中的滑块或其他任何东西都不会取代 Chatbot,而只是稍微扩展 Chatbot,如果 Chatbot 继续改进的话,这些滑块之类的东西压根无用。 「希望我已经说服你,Chatbot 对大模型来说是一个糟糕的界面」,我对此没有疑问。只是我依然不同意,而且这篇文章没有提到的是「Chatbot 不是未来」。Chatbot 对大模型来说确实是一个糟糕的界面,但它一定能成为我必须访问的 top3 网站中占据一席之地。 我认为这篇文章的重点是聊天并不是 AI 真正通用的用途。AI 的强大无可置疑,只是文章想说明自由形式的对话没有未来。作者并不是说 GPT 毫无用处,而是说我们还没有把它放在最佳环境中。这也是为什么每个人都对「提示工程」感兴趣的原因,因为它可以更好地帮助我们利用 AI。最大的用户价值仍将比我们现在拥有的开放式聊天UI高出一个级别。 对话是未来吗?
我认为 Chatbot 是未来,但作者的观点依然有效。它确实不提供预设用途,但是 Chatbot 提供了一种以前不可能的渐进式披露和直接交互形式。之前的工具栏和菜单提供了预设用途,但用户仍然需要知道调用什么内容以及使用它们的顺序。比如「我想将此文件作为 PDF 通过电子邮件发送,同时打印」这个指令在聊天 UX 中可能比在基于菜单的 UX 中容易得多。 我认为作者的观点非常正确。Chatbot 根本无法做任何事情,空文本输入也无法引导用户了解它能做什么,以及它擅长什么。仅仅因为系统有一个大模型可以与之交互,并不意味着它会突然支持用户想要完成的任何所需操作。 聊天不是一个通俗优秀的界面。但这是一个很好的默认形式,因为它是完全自由的。使用大模型为当前的任务设计用户界面应该很容易。 与上下文相关的建议选项(只需单击一下即可操作)以及自由格式输入框将成为常态。人们期待和所有 APP 聊天。他们将看到一个输入框,所有 APP 可以理解自然语言并以最有用的方式响应。 某种程度上自由格式文本输入比结构化输入更好。
一个例子是:人们更喜欢用简单的搜索框,而不是复杂的高级搜索表单,更不要说过去的门户网站。 不过用户会对 Chatbot 期望很高,当你要求它解释它的推理时,大模型永远不知道它为什么要解释它所做的事情,但它无论如何都会试图给出一个合理的解释。虽然错误,但仍然能够帮助用户了解他们之前不知道 Chatbot 能做的事。 未来 AI 形态设想
我认为未来的界面是生活的智能助手,它可以给我们工作和生活上的建议。推动这些建议的是所有个人数据,以及用户可以用自然语言提供给助手的目标和价值观。我们将生活在一个 AI 和人类共同生活并携手做出决策的世界。 未来可能是即时生成根据用户学习的偏好定制的前端。动机源于人类是糟糕的学习者,这样完全省去了学习新界面风格的麻烦。在极限情况下,有可能实时生成一个完整的世界,实现扎克伯格的梦想——一个完全孤独的 matrix。 如果遥远的未来(100 年之后)出现了能够使用口语交谈的合成人形生物,那么 Chatbot 就只是人类通往与 AI 进行更高级通信形式道路上的一个途径点。
关注 Founder Park,我们将持续推出更全面更深度的大模型相关讨论与报道。
如果你有投身大模型创业的想法,欢迎加入我们的大模型相关领域交流群,来一起探讨大模型时代创业的共识和认知。
长按识别二维码填写入群申请表
在 ChatGPT 发布后,我们迎来了一个全新的创业时代,似乎又回到了移动互联网早期——大量产品的方向和定义还不清楚的时代,我们希望把更多愿意思考和有创业意向的人聚集在一起,连接更多大模型领域的 doer(实干家),让更多有价值的认知在这里流动、碰撞、凝结,孵化出更多优秀的产品和项目。
Founder Park 计划搭建一个大模型相关领域的交流社区,面向有志于在大模型相关领域创业的创业者、产品经理、工程师、学者及投资人,围绕大模型相关创业的新项目、新赛道进行交流探讨。
在这里,你可以获得大模型相关领域的最新动态、高质量的对话交流,结识更多高净值的创业人群,同时,极客公园也会为优秀的项目提供资金、人才及其他资源的支持。
针对数据安全问题,微软将推出私有版ChatGPT,价格贵10倍
图灵奖得主、谷歌副总裁 Hinton 离职,对毕生工作感到后悔和恐惧
Ilya 斯坦福访谈:AI意识,开源和 OpenAI 商业化,AI研究的未来
AGI 时代的创业公司新形态:11 人的 Midjourney 不是偶然