2025伊始,万字长文刷新AI产品20个认知
2024 飞逝而过,我们踩着坑,跌跌撞撞
摸着技术摸着行业,也摸着用户前行
逐渐积累了一些新的小小认知。
一直希望与朋友们分享,
以致敬技术爆炸的 2024 年。
拖延症发作至今… 再不写就过点儿啦 😂
后文中,我努力体系一些,分为为三个篇章讲述:
行业篇
产品篇
个人篇
Ps. 由于个人视野与精力有限,难免存在片面观点…
如果存在错误,欢迎指正,敬请后台留言交流。
行业篇
1、产品迭代速度远不及技术爆发
ChatGPT 引爆了人工智能领域,2024 年技术层面百花齐放,而相比于 2023 年,产品的迭代明显跟不太上节奏。
今年是 AI SOTA 起伏跌宕的一年,AI 技术爆炸,而产品却线性增长。
资料来源:天津市人工智能学会、至顶智库
可能有下面的几个原因:
1、 产品的演进需要较长时间打磨
对于大部分公司而言,从发现新技术,调研与Demo,再到产品落地,
结合过程中沟通协调、迭代测试…
走到上线,全程保守需要 1-2 个月的时间。
而在这段时间之内,技术很可能已迭代了多版。
我们也能看到,一些大厂采用后发先至的策略,
以稳定的方案结合流量抢占市场…
2、AI技术与产品都处在快速发展的不稳定态
新的模型、算法层出不穷,
但如何将这些技术转化为稳定可靠的产品功能,
仍需要时间的沉淀。
首先,并不是所有的 SOTA 都适合落地,
其次,SOTA 技术落地到用户应用中,并不是简单的过程,
更别说一些 SOTA 包含宣发、营销等目的,
刷榜、刷数据…
比较稳定范式落地,也会面临很多问题,比如:
范式与用户的使用场景不匹配
范式部署代价(token 或者调用成本)高昂
即便范式有效,对于大厂而言,
需要耗费几个月的时间打磨好落地到产品。
落地之后紧接着发现:这个技术已经过时了。
我在与许多团队沟通的时候,他们表达:
评估是否采购新兴能力时,
对于技术被快速淘汰的疑虑大于新能力的渴望。
毕竟:又不是不能用
2、2024 从技术追赶进入应用深化
我从 aigc.cn 收集整理了全部的资讯与产品,
整理了 2023 年与 2024 年资讯词云,
一些有趣的变化:
1、技术焦点从 ChatGPT 和 模型向 模型应用转移,kimi、豆包、即梦等声量提升
2、2024 ,更讲“落地”、“场景”; 而并非去年更宏观的“产业”、"技术"、“发展”
2023 资讯词云
2024 资讯词云
总的来说,2024 大伙都更加务实,
无论是投资者还是创业者,不再宏大叙事,
转为探索的落地业务。
3、全球市场赢家通吃,国内多级竞争凸显
下面是基于 aibase 最新一期产品榜单整理的散点图,
对比国内与全球,
1、GPT市场份额毫无悬念的断崖第一,紧接着就是 canva 和 Gemini。
全球市场在 OpenAI 、 Google 等公司主导下,
体现出典型的赢家通吃局面,马太效应明显。
OpenAI 等大公司快速迭代和带来标准的统一,
在很长的一段时间,友商只能跟进。
2、产品丰富度上呈现显著断层,
这主要是因为面向全球市场的产品往往追求规模效应,
导致大DAU产品占据主导地位。
如果创业面向全球市场,“小而美”的策略或许仍然奏效。
而反观国内的市场,
却呈现了“百花齐放”的姿态,更加注重实用,
且不同于互联网 “BAT”竞争大格局,
细分领域都赛出了赛道黑马,
比如搜索(夸克 6700W)、
Chatbot(kimi、豆包)、
音视频(即梦、可灵)等,
但这些毫无例外,都是“资本加持”的产物…
对于创业者而言,
可能需要避开在内容生成层面卷,
而要考虑解决少部分用户,小细分场景,
把付费做起来,
先活下来,避免陷入同质化竞争。
两边的市场都呈现:从通用平台向垂直应用的演进,
可以看到 DAU 稍小的 AI 产品的增量都较为显著。
全球 DAU Top100 产品分布
国内 DAU Top100 产品分布
Ps. 如果想查看完整的交互图表,
请在后台留言 “全球” 或 “国内”,获取动态图表。
23 年我觉得:“垂类”空间挺大,
但随着AI基础模型的持续迭代,
纯依靠内容生成的创业优势正在被快速削弱,
创业团队优势会越来越少。
我在想,如果我还在继续创业,我可能会:
结合我之前的经历或者能明确接触到的专业群体,
绕开豆包简单 prompt 就能覆盖的内容,
找到明确的刚需场景,
通过独特交互,结合 LLM 能力,切非常小的场景打磨透,
先提供差异化的,内容优化的差异化体验,
把留存做起来,可能存在一定商业化空间。
而基于工作流的产品(用扣子、dify等产品快速搭建的小应用)
或纯套壳的产品,在友商的激烈竞争围剿下,
难以再积累 To C 优势。
所以可能不会再考虑生成更通用内容的产品。
AI 时代,想法更加不值钱了。
如果有通用的需求和场景,大厂只需要花一周就能把交互抄过来。
所以,只能找大厂ROI 不高的场景入手,找到小众但能给钱的群体,
先让公司活着(上线就必须要收费),再想办法融资。
4、面对用户基础需求,国内模型能力已追平甚至超越海外
原本对于国内外模型的限制,我很担心产品效果会打折扣,
事实上,我相当多虑。
在过去一年,我见证了国内模型能力的快速追赶。
从最初“接近GPT4 水平”,到现在在一些领域成为 “SOTA”
以文生图的场景为例,可灵、即梦、元宝等在亚洲人绘制上远超 Midjourney,
对东方美学的理解更为准确,
在古风、国潮等风格上尤为出色,
对汉服、古装等传统服饰的细节还原度更高。
样张来源:机器之心 2024年12月29日推文
样张来源:机器之心 2024年12月29日推文
样张来源:数字生命卡兹克 2024年12月19日推文
产品篇
5、用户的需求并没有改变
很多人认为 AI 的出现会改变一切,但我觉得:
用户的核心需求从来没有改变,反而因为…
有了 AI 之后,对内容质量和响应速度的要求更高了
是否使用 AI 或者 LLM ,是开发者的选择,
而不是用户的。
大部分用户根本不知道也不关心是否有 LLM 参与,
他们只希望更好解决他们的工作,
节省出时间来摸鱼。
比如:
文案创作依然聚焦于"生成-修改-优化"的核心流程
游戏原画依然围绕"构图-调色-细节"的基本需求
办公效率依然围绕"输入-处理-输出"的工作模式
这也解释了为什么很多纯堆功能的产品很难真正打动用户。
技术和能力只是噱头和手段
解决用户需求才是目的。
所以在规划和设计产品功能时:
与其追求大而全,不如做透一个功能,思考用户需要什么,再动手。
6、哪些产品值得用 AI 重做一遍
有句话说:"所有产品都值得用 AI 重做一遍。"
但我觉得还有一句话更重要:"选择比努力更重要。"
那究竟什么样的产品值得用 AI 重做?
一些功能稳定的产品,比如计算器、日历、天气这样的工具,
不需要急着 AI 化,优先级可以往后放。
我想,值得重做的产品,需要参考"三高一准"特征:
三高就是:高频刚需、高错误代价、高机械性
一准就是:AI 生成产物只需评价"准不准",而不要评价"好不好"
满足以上特征的才需要考虑重做或者 AI 化。
首先是"高频刚需":
写 PPT的时候,天天要改字体、调间距、换配色、改边距...
每次要交材料,都要全文替换标题、逐页检查段落、重新排版、统一页码...
每次处理表格,不是要求加粗就是斜体,今天改行高明天换背景色...
然后是"高错误代价":
对账时,漏掉一笔收入或多记一笔支出,差个一分就要老命…
投标时,格式不规范被否,条款不完整被退,错过截止全寄…
分析时,一个指标算错,汇报时被发现,那就…
写材料,领导讲话引用错,那就… 不用多说…
以及"高机械性":
写材料,找素材找半天,调格式调到吐,改表格改到眼晕...
回邮件,一些套话回复要组织语言,事项要加 TODO...
最关键的一点:
AI生成内容不可避免幻觉或者不稳定,如果结果需要用户评价“好不好”,
那完了,用户就会开始炼丹。
因为用户总会对“下一次”抱有很高的期待,我们的 Token 和算力就在燃烧。
所以我们可能会聚焦在“准不准”的场景,比如:
数据对不对,格式规不规范,内容全不全,逻辑通不通。
因为这样设计,
用户不用评价内容好不好,
价值就在那里,明明白白,
也能促进付费决策…
用 WPS 举个例子,下面场景抓得比较准确。
解决:写完 ppt 套自己公司模板的问题,
把半个多小时的调格式的时间节省下来,
内容不在“好不好”,而是格式“对不对”上。
虽然这个不一定是驱动付费的场景,
但这个能力可以是付费的重要原因。
7、商业化层面,做性价比高的功能
接着上面关于 “内容质量”的话题,
如果用户对内容有诉求,而且养成重试习惯
持续炼丹 带来 Token 成本上升。
而且这些场景海了去了…
有哪些能够更好评估优先级的办法呢?
在实践中我简单列了一个公式:
TE = 效率得分(越高优先级越高)
U = 用户覆盖率(或者渗透率)
C = 付费转化率(或者留存)
P = 客单价(或者付费意愿)
T = Token 消耗
简单来说,
在 token 相同的场景下,
要么能换用户量,
要么能换付费转化,
要么能换高单价。
三头总得保一头。
如果三头一个都保不了,那…
在商业化层面,可能没有太好的预期。
8、 在同样市场预期的产品中抉择
对于被淘汰的恐慌,以及损失厌恶的心态共同推动付费意愿。
就像这张图…
用户:帮我写一份产品周报
AI:好的,请提供具体的更新内容和时间范围
用户:上周我们优化了搜索功能,修了几个bug
AI:产品周报
时间:xx月xx日-xx月xx日
本周更新内容:
1. 优化搜索功能
2. 修复系统bug
工作详情:
1. 搜索功能优化
- 提升了搜索性能
- 优化了搜索体验
2. Bug修复
- 修复了系统存在的bug
- 提高了系统稳定性
结果:内容过于空泛,缺乏具体信息,基本没有参考价值
换到文档写作场景,用户可能正在写一份工作报告或者方案,
他们不会也不该在写作过程中添加各种注释和标注。
如果要求用户像程序员那样写注释,反而会打断用户写作思路,增加不必要的负担。
比如:用户在文内写下,我计划在后面加一个比喻句…
这就很…怪。
所以,文档写作的 AI 需要更好,
更智能地理解用户的写作意图。
它需要分析用户已经写下的内容,
捕捉行文脉络,预判下文走向,
在用户需要的时候适时提供帮助。
这种辅助应该是无形的、自然的,
就像旁边有一个写作大神和你一起,
既不打扰你的思路,
又能在你需要的时候给出恰到好处的建议。
更为关键的是,AI 生成的内容必须在用户的掌控之下。
让用户可以一眼看出修改建议,并自主决定是否采纳。
这种"所见即所得"的体验,让用户始终掌握着写作的主动权,
避免了那种"AI 牵着鼻子走"的被动感。
掌控感对用户而言非常重要,
这也是我希望 AI 和用户达成的默契:
顺应用户的写作习惯,而不是强迫用户改变习惯去适应 AI。
一个精心准备的demo,往往掩盖了产品化过程中的诸多坑。
游戏有个概念叫 beautiful corner,
简单来说就是在理想环境下,
通过堆料证明效果,
在该场景中不计成本地展示。
真就怕…Demo 做个小半天,调优改造一个月。
最怕做成产品,就像过山车一样…高开低走。
首先是稳定性,
Demo 展示最优路径,环境可控,
万事俱备,而且大家都能接受存在一些 bug;
而实际场景下,用户输入千奇百怪,各种边界情况层出不穷,
用户的使用习惯更是难以预期…
其次是成本,
Demo 可以为了达到目标不计代价(甚至性能代价);
而实际商业化应用,每一个Token 都要精打细算,
实际应用中,响应速度、并发数、成本控制…
Token、算力烧起来都是真金白银,每一项都是拦路虎。
比如:生成一张图要等 30s,用户能等么?
一天要烧几十万 Token,能撑得住么?
最关键的是价值,
Demo 未必能解决用户痛点,
即便解决了,用户也未必买单。
变现模式需要探索,
ROI 更是难以评估…
比如:这个功能确实挺好,但用户说:
"又不是不能用…而且为什么要花钱…"
所以,我们在做完Demo 之后,就开始往回收,
然后思考下面三个问题,尝试找到产品化的"必要性"。
如果没有这个产品,用户会痛么?
用户愿意为这个痛点付费么?
我们的方案比现有功能好在哪?
毕竟,技术再酷炫,不解决问题就是玩具
Demo 再惊艳,不赚钱就是负债。
16、不能把 AI LLM 当函数在使用 / 设计
去年,无论是内部还是外部,
一些产品经理把 LLM 当作函数在用,
用户的原文或者请求作为输入,
AI 生成的结果就是输出。
有的时候,甚至寄希望于一个 “完美的 prompt”解决所有问题。
实际上,prompt 越写越长,维护成本会直线上升;
而且promopt很难实现边界条件的处理,
当场景复杂的时候,真的就是调试和迭代变得极其复杂。
真就是…
一壶茶,一根烟,一调 prompt 搞一天。
一些复杂的场景,如果在实现层面没有用 扣子、dify 这些流,在程序上也要与开发达成流的概念,多次调用 LLM 完成一次请求。
比如一个客服场景,AI 要同时完成:
意图识别、情绪判断、话术生成…
结果就是一个超长 prompt,既要判断又要生成。
可以考虑拆解:
1、分类模型做意图识别
2、情感分析模型判断情绪
3、对话管理框架控制对话
4、RAG 召回专业内容
不能让 LLM 既当裁判员,又当运动员…
17、工程化优化方向要避开内容生成部分
工程化同时,需要关注 LLM 升级方向,避免被模型升级取代。
过去一年,我们在内容生成优化上吃了不少亏。
年初花大量精力优化内容质量,
下半年模型一升级,好家伙,我们的努力几乎被直接取代…
对于自家产品迭代,走了一些弯路不打紧。
最怕是… 友商后发先至,通过新模型 + 砸流量 + 砸资源
不但端了我们的饭碗,掀了我们的桌。
在内容生成这块跟大模型硬刚,性价比着实不高。
AI Con 上分享的结论
如果做 AI 应用,考虑在 大模型 内容层面以外的部分着力。
比如:
1、交互体验层面:
基于响应速度快的模型做好交互,
通过改善交互方式,提升 产品效果
2、专业领域知识整合
AI 难为无米之炊,对于数据源的拆段、向量化和召回等环节
也可以深入设计。
说白了,得在"内容生成"之外找差异化竞争点…
毕竟模型迭代太快,光靠堆 prompt 已经玩不转了…
个人篇
18、掌握 AI 能力边界才能更好设计产品
就像 1999 年的互联网那个时代,
那个时候的产品复杂度,需要的协作度还不庞大时
当时的产品经理需要技术出身(比如张小龙大佬),
对各种技术有深入理解时,开发主导,能设计出许多可靠好用的产品。
下面是简单罗列产品经理能力雷达,仅做示意。
今天的 AI 产品刚刚起步,产品经理可能也面临类似处境:
AI 技术还在快速迭代,能力边界也不稳定,
如果不了解底层原理,很容易陷入两个极端:
高估 AI 能力,设计无法实现的功能
低估 AI 潜力,错过创新机会
我在与各类公司伙伴沟通时发现,
一些产品经理高估了 AI 的能力,
低估了产品化过程中的困难。
似乎:
以为 AI 能完美理解所有用户输入
认为提示词优化就能解决所有问题
期待一个模型解决所有场景需求
忽视了 Token 消耗带来的成本压力
这些认知偏差导致产品设计走入新误区:
1、过度依赖单一模型能力
在模型解决不好需求的时候,
考虑的是调 prompt 而不是换模型或者换技术手段。
因为他们可能不了解新的技术手段…
2、低估运营和维护成本
对于不同的模型,接入代价不一样,
不同的技术方案要求的技术栈也不一样,
需要产品经理对方案有足够的了解,
才能更好与开发一同制定功能策略,
才能选择最适合的模型来解决具体问题,
而不盲目追求最新最强…
19、AI 时代催生新型复合岗位
国内 AI 产业蓬勃发展,同时催生挺多新岗位,
目前许多产品经理转型为 AI 产品经理,是一个大趋势,
我觉得,在 AI 产品迭代过程中,可能还会产生更多复合型的岗位。
以游戏行业为例,TA(技术美术) 和 TD(技术策划)
他们分别融合了 开发和美术; 开发和策划
他们是开发中最懂美术效果的人;
是美术中最懂写代码的人;
AI 行业的持续迭代,
需求与解决方案逐渐复杂,
必然也会产生横跨技术、模型和产品的 TPM。
能力融合是必然的趋势。
而且… 这个岗位在短期内可能不会消失。
去年,几个算法工程师和产品经理坐在一起,
可能就能打造出很很棒的 demo;
因为场景简单,需求明确;
过程中完全不需要一个“中间角色”来协调工作。
比如简单的图像识别,或者套壳、Agent 工作流,
大概几个小时,一个下午的时间对齐就能搞定。
但当 AI 应用逐渐走向工业化,
我觉得情况可能会有所改变。
当一个项目需要处理成百上千种边界场景 当一个功能要应对各种千奇百怪的用户输入 当成本控制成为项目成败的关键因素 当产品体验需要持续打磨和优化
这时,仅靠工程师和产品经理的直接沟通可能无法支撑。
需要一个角色来:
制定标准化的内容生产流程 搭建高效的工具链和管线 平衡技术实现和产品体验 控制开发和运营成本
TPM 既要理解引擎的能力边界,
又要知道怎么做出好看的效果。
两个领域都要精通(熟悉),才能创造价值。
这样的 TAIPM(Tech AI PM)
看似只是在写提示词,
实际要懂 NLP、懂业务、懂优化、懂成本...
看似只是在出功能方案,
实际要懂 RAG、要懂 PAL、 懂Ranking…
样样都不能少。
这个岗位和 prompt 工程师类似,但不一样。
举个例子:
优化对话质量
调整提示词和参数
处理异常回复
关注模型输出效果
模型选型:这个功能用什么模型更合适 API 成本压缩:如何控制API调用成本 AI 高并发方案:怎么处理高并发场景 内容管理:生成内容版本管理与评测 产品体验:持续优化 AI 感知
如果项目规模较小,
或者已经有非常成熟的解决方案可以直接使用,
那可能并不需要专职的AI技术策划。
但对于那些需要深度定制、规模复杂、
要求持续迭代的AI应用来说,
这个角色就变得不可或缺了。
最近翻看其他厂商的招聘JD,已有类似的趋势。
20、只要不被干下牌桌,就是胜利
这波 AI 浪潮来得太快,
GPT-4 刚出来,Claude、Gemini 又来整活,
国内模型往死里卷。
每天刷到的自媒体都在说:
"震惊!AI 要替代这个..."
"颠覆!AI 要颠覆那个..."
直播上各种贩卖焦虑:
"完了完了,这下真要失业了"
"再不学 AI,就要被淘汰了"
"XX行业要完蛋了..."
搞得贼儿焦虑…
不过,我看来,这就像一场大牌局:
有赌未为输。
有人梭哈 All in 搞 AI,
有人稳坐观望,
有人还在学规则,
或许也有人已经Out了。
关键只是:
手里有好牌不一定要马上出,
手里没牌也不一定就输了。
比如现在的 AI 岗位:
Prompt 工程师、AI 产品经理、模型训练师...
看着都挺不错。
但每个岗位背后,都需要扎实的功底,并不是说转就转。
要懂技术原理
要懂产品设计
要懂成本控制
要懂商业变现
与其盲目跟风,不如先摸清自己的底牌,
看看手里有什么筹码,等待合适的机会。
反正...
牌局还长着呢,
慌也没用。
毕竟...
市场有起有落,
风口有来有去,
能留在牌桌上,
就还有机会。
谢谢 WPS ,谢谢 Kelly。
2025,不要慌,不要慌,太阳下山有月光。