查看原文
其他

文心一言疯狂发垃圾短信背后的三大启示

Super黄 AI产品黄叔
2024-10-03

文心一言疯狂发短信的背后反映了什么问题?

是道德的沦丧,还是人性的扭曲?

作为一名资深的产品经理,我不禁要深思,为何国内大模型这么卷,迫不及待的抢用户真的能保证用户体验和积累长期价值么?

我们今天聊聊这件事

Take Away:

1. 文心一言的产品定位是“你的智能助理”

2. 这个定位要做好需要几个关键要素

3. 狂发短信的背后反应出焦虑


01 什么是文心一言?

“文心一言”作为百度全新一代知识增强大语言模型,采用一对一的对话式聊天场景,能够与人对话互动,回答问题,协助创作,同时在文学创作、商业文案创作、数理逻辑推算、中文理解、多模态生成等多个应用场景中高效便捷地帮助人们获取信息、知识和灵感。


Slogan:你的智能助理

简单说,就是个ChatGPT的国内低配版,至于哪里智能,有多智能,就比较依赖于它的底层大模型能力了,半年前广为传播的特色菜名,体现了当初的智能程度:

当然,此一时彼一时,相信随着不断的训练(修正),现在这些问题都得到了解决:

为了帮助大家解决怎么“智能”的问题,文心一言很贴心的预置了大量的模版:

比如我们选择职场效率里面的日报模版,支持修改【】内的文字,来实现prompt定制,从而帮助用户快速的完成输入:

对于这类标准流程的内容,文心一言的生成质量还是OK的。

所以,我们看下来,就是一个预置了大量prompt模版的国内低配版ChatGPT

02 做好你的智能助理,需要几个要素?

这个问题,我问了Claude,答复是这样的:

  1. 理解用户需求:要深入分析不同用户的实际需求和痛点,不能简单地套用统一的模式。
  2. 个性化服务:应该针对不同用户提供个性化的服务和内容推荐,而不是全部用户都获取相同的经验。
  3. 多场景适应:不仅要针对聊天做优化,也要考虑到文心一言在其他场景(如搜索、提醒等)的表现。
  4. 知识图谱打通:要积累各领域知识,并建立起知识关联体系,才能更智能地处理各类问题。
  5. 持续学习:需要不断学习和积累新知识、新技能,才能随时助用户一臂之力。
  6. 语言表达能力:对话语言要更自然、流畅,减少模板和重复话语。
  7. 情感系统:要注意用户情感,提供符合交互情境的回复。
  8. 安全可控:避免产生错误信息、内容,建立可靠的安全监控系统。

按照这个划分方式,目前的文心一言,并没有做到“你的”专属,也没有做到足够的“智能”

因为 1没有真的去理解用户的需求

2没有个性化服务,

完全是前端提供输入框,后端统一输出

所以,你的智能助理,在目前来看,只是一句空话。

相比于其他产品,只能靠大模型对于内容的输出能力来PK,完全是看硬实力

由于产品并没有实现理想的定位,就急吼吼的推出,会导致用户打开后一脸茫然,使用体验后不及预期,很快在App Store榜单下迅速下滑:

03 急吼吼的狂发短信到底有啥诉求

所以回过头来,我们仔细琢磨一下,为何刚通过审查,就急吼吼的发短信让用户赶紧回来用?

甚至一发发N条,直接构成骚扰呢?

我认为有以下三个点:

  1. 希望构建数据飞轮
  2. 打出品牌,形成“名实唯一性”
  3. KPI导向

在展开阐述之前,我们先聊一个很有意思的话题:

为何百度没有把文心一言全量整合到搜索里面?

很大的一个差异点在于:Bing没有市场份额,而百度是巨头

全球排名第二是微软 Bing 搜索,市场占比 3.03% 

至今年 Q1,百度搜索占国内市场份额大约为 65%

尽管微软全球第二,但只有3个点看着也非常可怜。也就是说,Bing没有什么包袱,直接干一些颠覆的事吧,于是直接在搜索引擎里整合了GPT:

New Bing的使用逻辑是:

  1. 先直接给答案
  2. 答案里嵌入链接

我们知道,百度的搜索是这样的:

如果你仔细看,可以看到输入框下面,增加了一个“对话”按钮,我们点击后发现进入了类似New Bing的界面:

这个问题的背后也很好理解,如果百度全量按照New Bing的逻辑整合,那用户很可能会在获得答案后会干三件事:

  1. 直接离开
  2. 点击推荐的链接查看
  3. 继续对话

这三种方式无论哪一种,都会影响到百度的广告业务,也就是百度搜索结果里面,被插入的大量广告不会被呈现在用户面前,会大幅影响目前还是主力营收的广告业务。

所以,文心一言使用独立App向外推广成为了一种手段。

第一. 希望构建数据飞轮

我们知道,大模型核心是三个点:

算法,算力,数据

前两个目前来看,对于大厂问题不大,更重要的变成了最后的数据。

如果海量的用户持续使用文心一言,势必会在上面产生更加多的数据,以及对于数据的反馈,这样文心一言就可以进一步的优化大模型的内容生成质量,用户体验就会更好,从而获得更多的用户以及用户数据,形成数据飞轮:

早期获得更加海量的用户,先发优势一旦形成,我们设想一下Midjourney,在AI系列06:Midjourney和Discord互相成就一文里,Super详细的看了它们的数据,也确实是从太空歌剧院,这幅使用AI绘画能力的画作获奖后,引发的全球浪潮中,吃到了足够的红利,后面基于海量用户反馈做了快速的多次迭代,使得模型生成图片的质量快速提升,最终站稳了全球No1的位置:

第二. 打出品牌心智

要用就用文心一言

就像在国际上,大家形成大模型产品就是ChatGPT一样,国内百度肯定希望继续吃到这个品牌心智的。

这个叫“名实唯一性”

要搜索就上百度,要买二手车就上瓜子,送礼就送脑白金

在营销层面,大干快上,铺天广告能起到一定程度的品牌心智。

对于后续的获客会有很好的帮助,这就是为何过去几年互联网企业大手笔上春晚的一个重要原因,希望获得老百姓的心智。

第三. KPI

文心一言,发布了很久了,之前由于合法合规问题,没有办法大规模推广,现在通过了,作为百度的核心产品,岂有不大力推广的道理。

在Q2财报里,李彦宏也疯狂为AI站台:

“生成式AI和大语言模型在许多行业具有巨大变革能力,为我们提供了重大的市场机会。百度不断升级模型,生成更具创造性的回答,提高训练速度并降低推理成本,保持行业领先。” 百度创始人、董事长兼首席执行官李彦宏表示, “文心大模型3.5得到了云客户、AI开发者和行业专家的广泛认可。百度正在用AI原生思维重构产品和服务,为用户提供创新体验,并支持企业抓住机遇。百度致力于围绕生成式AI和大语言模型构建新引擎,推动长期增长。”

相信文心一言相关的团队和项目同事,最近也是抓紧内卷,扛着海量的KPI为了证明自己值这笔不低的工资而拼命!

如果我们有心去搜索百度的信息,会发现随着这两年大厂的裁员,人人自危,每个人都更加内卷,因为一旦被裁,就很难有公司再能接得住这么高的薪资,好不容易有个机会,还不玩了命?

用力过猛,会导致动作变形。

根据内部信息,文心一言的多轮对话次数并不理想

这意味着,有两个可能:

  1. 获得的用户并不是目标用户
  2. 产品使用体验不达预期

04 文心一言类的大模型App有什么问题?

我们看一下App Store上的用户评价:

推测大量在做刷好评操作,可以看到标红的两条已经被删除了-,-

大模型产品,很容易遇到以下几个问题:

第一. 产品无法解决实际用户需求

当前所处的embedding阶段,无法满足用户实际的工作流需求

embedding阶段指的是,用户提出提示词,丢给大模型,大模型给出答案。大模型并没有办法知道用户全局需要什么,只能就着少量的信息直接给出答案。

由于文心一言并没有做到真正的“你的智能助理”,所以不可能像跟了你一年的真人助理那样,在你做出看一眼茶杯的时候就能知道你需要喝水,茶杯里没水了马上给你倒水这个动作。

变成需要你非常具体和明确的提出指令,大模型再去生成对应的内容。

在这个限制条件下,就完全依赖大模型的内容生成质量!但是目前又很难达到用户满意的程度,这也导致了用户的不满。

注意呀,这个是场景问题,我们也同时能看到,百度系产品全面整合文心一言,比如百度文库:

用户停留时长翻了一倍,7天留存增加10%

这就是一个非常好的场景整合。

所以,大模型产品最大的问题就是:没有具体的场景

第二. 产品成熟度仍然不足

上半年文心一言迭代到了3.5版本,年底预计会推出4.0版本。

简单使用后会感觉到离Claude仍然有差距,但在部分场景下是可以用的,比如简单的工作日报生成。

倒是可以期待一下年底在技术层面文心一言会做到什么程度。

第三. 商业模式不清晰

现在toC应用还是处在抢用户阶段,使用免费的策略来获得用户是国内多年的常用手段啦。

但在大模型层面差异化不足的时候,单纯的大模型产品商业模式是完全谈不上的,只有真的做到了“你的智能助理”,才能真的形成清晰的商业模式。

Super给出的建议是

优先发展垂直领域应用,结合特定场景和老需求开发。

这是目前可见的,很具体的AI时代产品范式。

我们看一下百度输入法最新版本的更新说明:

  1. 基于文心一言,重磅升级!「超会写」功能上线,AI写作助手一键帮你写全文、续写、润色,全方位辅助创作
  2. 超会写 - 活动方案、工作总结、营销文案…各类文稿交给TA,高效又便捷
  3. 超会写 - 灵感枯竭不用怕,写小说、写文章一键帮你文本润色,激发创意、文采飞扬
  4. 超会写 - 分析报告、年度规划…不知从何入手,快速帮你搭框架、写大纲,打开思路、高效工作


输入是老需求,在老需求上面寻找AI可以优化的点开发,是更合理的方式。

大模型产品本身在资源充足的情况下做探索是OK的,但不要竭泽而渔。

百度本身的名声就不好,魏则西事件让我们一直记到现在。

3月份文心一言文身图的松鼠鳜鱼等出圈,带来了流量,以及很负面的评价,对于大厂来说,“黑红”不是红啊!

要想一个问题,画成这个鸟样,是,用户看到了破圈之后,兴冲冲的上来使用文心一言,然后呢?然后再也不用了。

要知道,信誉是资产,不要竭泽而渔,为了短期数据去消耗

总结

文心一言上线短期内大量发垃圾短信引发争议,的确让我们感到遗憾。然而站在技术演进的高度,我们也应理性看待这个过程。

通用人工智能仍处于起步阶段,在提升自身能力的同时,也需要我们给予时间理解、引导和迭代。苛责一个婴儿不能马上跑步是不公平的。

此时此刻,技术公司应该慎重看待大模型,不能过于急功近利。而我们每个人,也应当积极承担起用户的责任,用理性、耐心和同理心,帮助AI健康成长。

这是人类社会一个全新的课题。让我们心怀开放,共同思考如何能在技术革新中,建立起共享繁荣的局面。

未来可期,道阻且长。行者何惧,无畏前行。

你怎么看?欢迎在评论区一起讨论,也欢迎转发给更多睿智的朋友。

——END——
*作者简介:
Super黄,广西人,毕业于北京邮电大学,现居北京,
11年产品经理,全网10万粉丝。

AI产品咨询、AI产品顾问:加微信交流。

开始全力研究AI、AI产品,欢迎连接~
微信号:lookforward
长按下面二维码添加好友(备注“AI”):


继续滑动看下一个
AI产品黄叔
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存