查看原文
其他

看目前巨头的AI原生产品布局(2),兼谈杀手级应用【2023Q4】

孔某人 孔某人的低维认知
2024-08-22

TLDR

本文是 【2023.10】看目前巨头的AI原生产品布局 的续篇,从讯飞2023.10月发布会继续讨论。我本来想要在标题中加入是讯飞专题,但本文顺着讯飞的产品也推出一些重要的看法,所以还是仅仅标记为(2)。

ChatBot上的角色功能会成为虚拟员工/虚拟专家的入口。

“讯飞晓医”会是一个杀手级产品,而且是足以成长为巨型的产品,但它很难被抄。

0、前言

我没看发布会回放之前也没有什么期待,不过既然有回放和低成本的扫描方式还是抓来过了一下,然后发现我错了。

2023Q4大概会是大厂的AI原生产品爆发期,百度如此,讯飞也不算差。当然这两家都是把AIGC作为自己10年一遇的大机遇来对待的,看起来已经是全公司的战略重心,所以他们的行动也较快。

写完第一篇之后虽然没多久,不得已还是得写一下讯飞的。由此看来本文的主题大概会形成一个系列,每家大厂的发布会之后我大概都得来补一篇

虽然我并没有站在讯飞的角度上思考过,但这次的发布会内容确实是让我意料之外的。正如我在第一篇中所说的,外部的个体没法预测大厂的战略,我能做的只有跟随评论而已。

1、讯飞发布会回顾及个人评论

需要指出的是:这个发布会,第一位上来发言的人是 安徽省委常委、副省长张宏文。这是跟所有大厂都不同点。

1.1、简易应用自动生成

一开始的宣传片中,放了一个简易应用自动生成的视频。

虽然说后面并没有展开来讲,实际效果是否能实现那样的多端联动也有待后续客户观察。但这个需求是真的。

很多场景下,用户需要一些简易的应用开发能力来将一些流程固化和自动化。他们对于单次需求开发的付费能力较低,但他们需要的功能也不复杂。问题只在于人类开发者的成本太高,以及他们需要在不断的体验原型中才能摸索清楚自己的需求。这件事很适合AIGC。

1.2、星火大模型3.0

  • 3.0上线了,API价格跟2.0一样。4.0要明年上半年了,4.0才是对标GPT4。

  • 主要提升了英文能力、数学能力、代码相关能力。

  • 优化了文生图的效果。

  • 多轮对话中有自主追问的能力

  • 针对性的做了人设、角色扮演方面。(但在API上没看到这方面的指定方式)


1.3、ChatBot产品的助手、有伴功能

ChatBot产品上的“助手”和“有伴”在我来看是类似的功能,不过前者可能更偏功能性,后者更偏娱乐性。

我认为在实现技术上其实都不需要做特别明确的差异。娱乐性就不需要调用外部函数了?你不觉得虚拟的爱因斯坦应该会算算数么?

其实我觉得都不用特意区分功能性和娱乐性,我就希望虚拟的麦克斯韦能帮助我更好的分析电磁学问题,希望虚拟的爱因斯坦能帮助更好的理解相对论。这是娱乐么?这不是娱乐。这两类其实只是对于用户来说检索的tag不同,用户检索时候,首先想到的是“一个物理教授”、还是“爱因斯坦”?是“一个专业的哲学家”、还是“康德”?这样的差别而已。

我之前在 虚拟员工类产品 的实现方式思考 【2023.9】一文就提过我更看好服务型的产品,而不是一个等待用户自己灌数据和调教效果的RAG类技术方案。而ChatBot上的这种虚拟专家/虚拟人物似乎就是比单独的虚拟员工平台还要更好的流量入口,它不止可以包括character.ai,也可以包括【通用的】虚拟员工Agent。有什么能阻拦它呢?没有。我原本还以为可能需要一个虚拟员工/专家平台,但现在我发现可能不需要。一切靠效果说话就好。

有伴的用户创建页面是经过PM设计的,不是一个技术向的简单丢一个system prompt文本框就完了。很明显是为了不了解RAG技术的用户所重新组织的,包括如下的可指定项目:

  • 音色

  • 角色的自我介绍

  • 社会身份

  • 对话背景

  • 性格设定,分为外向性、抗压性、友好度、开放性、责任感等维度,每个维度5档。

  • 性格特点的文字描述。

  • 爱好

  • 口头禅

  • 语言风格,按场景逐个配置

  • 三观设定,世界观,价值观,人生观。

  • 外部数据集


这些可以靠一个支持system prompt的知识库产品就能实现,但这个产品设计明显对用户更加友好。同样的用户,看了这些配置,和面对一个system prompt文本框,能得到效果完全不同。

讯飞App上还提供了有伴的纯语音交互模式,和GPT Voice几乎一样。可惜TTS质量目前还很一般。

1.4、从 讯飞晓医 看真正的杀手级产品

讯飞晓医其实可以看成是一个2C的虚拟专家助手chatbot。但讯飞在这方面走的很远,这是一个深度定制的虚拟专家产品,包括如下功能:

  • 独立的App和小程序入口,快速进入,可以全语音交互

  • 针对医疗场景,默认用户不会一次性输入大量信息,会根据问题进行追问

  • 支持拍照上传,可以用来识别药品和上传检查单,似乎也支持直接拍照病灶来做初步诊断分析。

  • 定制的医疗领域大模型

  • (猜测)包含常用药、常见病的知识库

  • (预测)未来会进一步针对性的做检查单OCR识别,提升OCR准确率


【1】产品的价值

我对它的评价很简单:【我看到的第一个杀手级2C产品】,原因如下:

中国的医疗资源很缺乏,很多人没时间去医院,不愿意去医院,身边也没有医学的朋友可以咨询。但他们的初级医疗咨询需求是确实存在的。这个产品作为一个普惠产品,肯定比让他们去百度搜索、看头条上的各种养生文章好多了。常见病的诊断和应对并不难,更别说LLM其实比人还要擅长小概率病症的诊断。这个产品并不需要做正式的诊断,怀疑有病症时候告诉用户它的猜测,引导用户及时就医并提醒医生就已经很有用了。

更多时候是用药等等方面的咨询,这个对于用户来说要比后面再跑一次医院、上网搜索等等方便得多得多。真正做到随时遇到问题随时能找个普通号医生问一下,更别说认真做了一段时间之后我认为它可能还会比普通号医生更好一些。大城市可能大家觉得节省得是路程时间,但对于小城市来说,这可能是有无这类专科大夫的区别。越是下沉的城市,这个产品的价值越大。

现在的一些小问题,即使是大城市大医院,不做完各种检测也很难确定具体的问题。“小问题”重要的跑医院重要的是做检查,以及对检查结果的解读,以及开处方药。但普通人如何知道某些小问题其实有简单的解决办法呢?如何知道某些小问题其实是严重问题的征兆呢?但即使是在大城市,跑医院的成本都是较高的,而这种产品就可以有效地降低这方面的成本。

【2】壁垒与准入

从技术上来说,虽然它目前还并不完善,但我从技术的角度并不觉得未来把他做的追上一个医院普通号医生的单次就诊准确方面又多大难度。毕竟现在西医的很多问题诊断都得靠检查,而不是靠人工号脉。

但这个东西大家很容易抄么?我认为它的壁垒并不在于自己炼医疗大模型的技术,也不在于他的医疗语料数据。而在于中国官方、半官方的支持,或者说不禁止。讯飞发布会上提到了他们的产品研发过程得到了卫建委的帮助和指导。讯飞的更偏国企的背景让他们在这方面更容易,想想毕竟人家发布会都是副省长来站台。其他基座LLM小公司想抄一个,他们只是把技术做完了就行么?

【3】展望巨型杀手级产品

从这个产品更容易展望那些巨型的杀手级产品的轨道:衣食住行,以及几乎每个人都会遇到却仍然缺少低成本方案的领域,例如:法律、母婴、养老等等。

至少我觉得把这个思路搬到法律领域,做一个大家都用的起的法律咨询助手没有太多技术上的问题。前提是第一版就要做到位,至少到达目前讯飞晓医的水平。

【4】盈利方式与发展

更加难得的是,廉价的初级医疗咨询是一个公益领域。只要打着公益的大旗,做好隐私保护,跟监管明确责任划分,这就可以成为一个集合全社会所有力量的高点。在获得数据壁垒之前,一直靠着公益不盈利大旗没啥问题,估计2-3年应该差不多了。

短期来看,就算是目标是不盈利,如何能够负担大量用户的LLM模型推理成本可能也是个无法无视的问题。这个产品如果做成收费或者订阅估计在中国的情况下会比较难。但好在有着公益大旗,可以羊毛出在猪身上,我相信这不是我需要操心的事了。

1.5、星火科研助手

讯飞还另外推了一个web端产品,讯飞科研助手 http://paper.iflytek.com,包括如下功能:

  • 文献调研,综述生成。(目前接入的文献源还比较少,暂时是无用的状态)

  • 文献阅读辅助,ChatDoc类产品的免费替代。ChatDoc/ChatPDF直接就中枪了

  • 学术写作,包括word文档翻译和英文润色。


功能上没有太多可说的。我的感慨就是现在是免费AI产品越来越繁荣的时代,ChatDoc这就中枪了。

1.6、领域大模型

剩下讯飞还做了一波各种领域的大模型。

现在做领域大模型还有什么用我会单开文章来写。

我的关注点只是,这些基座LLM公司炼得领域大模型开放API么?支持继续微调么?希望他们能开这方面的API。

交流与合作

如果希望和我交流讨论,或参与相关的讨论群,或者建立合作,请私信联系,见 联系方式

希望留言可以知乎对应文章下留言


本文于2023.10.25首发于微信公众号与知乎。

知乎链接 https://zhuanlan.zhihu.com/p/663289366

个人观点,仅供参考
修改于
继续滑动看下一个
孔某人的低维认知
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存