和ChatGPT比，为什么百度即将发布的文心一言，我觉得是个智障？

Original 飞总本尊飞总聊IT 2023-09-04

本文首发微信公众号：飞总聊IT

前两天发的文章“卷死竞争对手！！OpenAI低价倾销ChatGPT”里面提了一下ChatGPT的竞品的情况。

其中我对百度是这样提的：

至于百度，等3月份真的揭开神秘面纱的时候，相信我，和ChatGPT比起来，一定是智能和智障的区别。
努力赚钱的小作者，公众号：飞总聊IT卷死竞争对手！！OpenAI低价倾销ChatGPT！！！

有百度的公关联系我，觉得我对百度的文心一言的理解有偏差，问为什么我就觉得ChatGPT如果有智能的话，百度的产品就是个智障呢？我是不是对百度的认知有偏见，在胡说八道？

坦白说，虽然说我也拿了PhD，但是那是大数据方向的，除了在大数据研究的时候有一篇论文用了一点点AI的东西，基本上我对AI，尤其是深度学习，NLP都是挺无知的。

但是，我这样想肯定也有我的思考和理由。所以我就整理了一下这些理由写出来，大家，包括百度的不是百度的，要是看了以后觉得我说对，欢迎给我点赞转发留言。要是觉得我说的的不对，也可以留言给证据，纠正我。但是我希望大家都能基于理性讨论。

先从这些天一篇有关中国和美国的AI的文章说起，是杜克大学电子和计算机工程系教授陈怡然写的。这篇文章读了很有感触。

他大概的意思是，我们可以把AI想象成一个小孩。欧美的AI走精英路线，出生以后家里一直砸钱到它博士毕业，然后一出场王炸。不管AlphaGo还是ChatGPT，一诞生都是一鸣惊人，诞生之前都是默默烧钱无数。

中国的AI走的是功利教育路线，出生接受的生存教育，养到15岁，家里就开始逼着想办法让它给家里挣钱，学的都是如何市场化的技巧。

陈教授说14年在百度的时候，机器人刚学会基本对话，就开始找盈利场景，于是出现了小度AI以及家电衍生物。18年加入阿里达摩院，对话机器人刚能开口说话，转向阿里小蜜客服机器人。22年加入字节，又是NLP搞机器人客服。

他觉得，在中国这AI就像是一个从村里走出去求学的年轻人，每经过一个路口，就有一群大爷大妈怼着说，哎呦，读博士花那么多钱有啥用，能挣钱不，还不如去厂里打螺丝，三年就盖新房了。

这段结合了陈教授自身经历经验的描述，说明了一个问题，在中国，搞AI，需要快速的盈利，而不是默默的日积月累。公司不可能很多年如一日的投入，不求回报，以期待突然之间横空出世，一鸣惊人。

陈教师的观点，以我个人在中国和美国企业里大数据团队工作的情况来看，我认可。中国企业对盈利的期待和渴望，比美国企业急切，很多时候最好是今天投入，明天就见到钱赚回来。

在这个观点的基础之上，我们来看一看文心一言和相关的东西。百度不是没有搞大模型，百度搞的大模型是什么呢？我能看到的，有个叫做文心大模型的东西。

百度有一个产品--文心一格，是个用AI作画的产品。国外AI作画的产品也有几个了，但是国内百度这算是比较有特色的了。

今年2月初网上爆料了一件事情。有人在文心一格上输入“一只爱国的猫”，让文心一格作画。画出来的猫里有美国国旗的背景。简单来说，爱国被文心一格理解成为爱美国。

我不太喜欢去牵扯非技术性的问题。所以让我们聚焦技术。从技术的角度来说，百度的文心大模型的数据训练集出问题了，用的数据集，训练出来导致了默认爱国等于爱美国。我无法判断文心大模型的原创性，但是请允许我质疑一下它的训练数据集。

百度是怎么修复这个问题的呢？把“爱国”，“爱国的猫”，等等所有你能想象得到的相关词语，都设置成为屏蔽词。让你在源头无法输入这些词，也就无法画出爱国猫等于有美国国旗的猫的画了。

从技术上来讲，看起来，这个大模型本身的语义问题没有修复，或者不容易修复，所以百度只能从用户输入端打补丁，阻止一些可能暴露大语言模型问题的输入。这是从文心一格暴露出来关于文心大模型的技术问题。

这里我们再从另外一个角度看问题，文心大模型到底是一个什么样的大模型？说真的，我也不清楚。

但是文心大模型的第一个应用是画画，那么我是不是可以理解，这个文心大模型里面，画画的训练多一些，聊天的训练少一些。

如果文心大模型已经可以有效对话了，按照杜克大学陈教授的观点，中国家长早就让孩子去赚钱了，我们应该早就见到类似画画的产品出来，给大家聊天了。毕竟中国的AI早熟，要早早的为家里赚钱养家。

既然我们只看到了画画的应用落地，却没有看到聊天的应用落地，所以我们姑且可以判断文心大模型一开始的训练优先级，侧重点是AI画画，不是聊天。

而当ChatGPT横空出世之后，百度的人才发现原来聊天机器人也可以火爆。所以，百度就需要一点时间给文心大模型喂很多语料，来提高其聊天的智能。

这也解释了为什么2月份就开始预热，非要到3月16日才官宣了。因为必须996，007的加班啊，趁着这点时间，赶紧大量的给文心大模型喂语言素材，训练催熟它不擅长的聊天的部分。

我们至少可以判断，在ChatGPT刚火爆的时候，百度的文心大模型并不是以聊天作为其最核心的训练方向的，通过二月份的爱国猫，我们还能判断，文心大模型即使是在画图训练的数据集上，也出现了一些语义的问题。

这样看来，这么急急忙忙的赶出来，3月16日正式登场的文心一言，让我怎么样对它有信心。难道它还能够比ChatGPT更惊艳？催熟做出来的东西，能比厚积薄发，默默烧钱做出来的东西更好？我是很难相信。

但是，百度还是有发布自己的文心一言的理由。陈教授说，中国的互联网公司，都是非常擅长市场化的。当别人都没有大模型的时候，百度好歹还有个可以被催熟的文心大模型。

催熟以后发布产品，大概率也比国内其他企业强。现在先市场化运作，先抢占中国版ChatGPT第一的位置，搞出新闻，搞出估值，肯定不亏。搞市场化，这是中国企业擅长的领域。

但是，本质上，我无法想象，如果百度早就有一个比ChatGPT还牛逼的机器人，百度还能忍着不赚钱不让大家知道，一直默默烧钱，只是为了让它更加优秀。所以呢？当然就是没有嘛。

所以如果ChatGPT的聊天水平叫智能的话，三月十六日登场的文心一言，可不只有一个智障的水平。

二湘：朱令去世一周年，清华学子控诉清华在朱令案中的冷血和无耻

“四川大学姜涛与爱人程月玲”，你们现在还好吗？

半年狂赚63亿了，微众银行董事长，还要卷员工

为了这部描述从“反右”到“文革”的禁片，田壮壮付出了十年不能拍片的代价

关于字节基建

和ChatGPT比，为什么百度即将发布的文心一言，我觉得是个智障？

您可能也对以下帖子感兴趣

二湘：朱令去世一周年，清华学子控诉清华在朱令案中的冷血和无耻

“四川大学姜涛与爱人程月玲”，你们现在还好吗？

半年狂赚63亿了，微众银行董事长，还要卷员工

为了这部描述从“反右”到“文革”的禁片，田壮壮付出了十年不能拍片的代价

关于字节基建

生成图片，分享到微信朋友圈

和ChatGPT比，为什么百度即将发布的文心一言，我觉得是个智障？

您可能也对以下帖子感兴趣