傅盛:大模型的弱点,才是我们的创业机会
The following article is from 笔记侠 Author 傅盛
时代在不断地改变,也在不断地催人改变。我想跟大家分享的主题是:大模型时代,创业者的机会在哪里?
我们都知道ChatGPT最近很火,他是人类历史上第一个仅用2个月,实现月活过亿的产品,最近月活已经突破10亿。这是在没有任何推广的情况下,完全靠用户主动使用,实现的自然增长。
其实这款产品只有一个聊天窗口(用户界面也并不出众),但为什么能在全球引发如此大的风潮?
今天我从原理层给大家解读一下。
最开始,我也跟大家一样,认为ChatGPT是一款聊天软件,它只是将庞大的网络知识重新整合了一遍。
直到有一天,我突发奇想,问ChatGPT“你知道为什么我们家的狗叫三万吗?”我给了一个提示,它被前主人遗弃,我在宠物医院收养了它。结果,ChatGPT回复说,“是不是做手术的费用是3万,你们取这个名字是为了纪念这次手术。”
我当时很震惊,因为我收养它的时候都不知道它叫三万,是医生告诉我,以前的主人带狗来治骨折,结果一听手术费要3万人就消失了,后来医生就给它取名三万。
我突然意识到,这些信息网上搜不到,ChatGPT不是根据过去知识的总结,完全是靠自己的推理得出结论。
所以,ChatGPT看上去是一个聊天软件,但本质上,它是个具有推理能力的大脑。
一、为什么是ChatGPT?
我们从原理层,去看一下这个事情。
作为创业者,我们必须学习,但学习是要从底层原理开始。不能因为自己不懂技术,就不从原理层理解问题。不然你会容易被网上各种各样的信息带偏。
今天网上对ChatGPT的讨论很多,有人将它神话,有人产生恐慌,比如人是否要被替代,它是否会产生自我意识。我认为这些都被过度炒作了。
从底层原理去理解,我的体会是:“语义理解,是人工智能技术的皇冠。”
我是有论据的,六年前,我们就投身人工智能,花了近10个亿去做研发,可以说积累了大量成功和不成功的经验。
我们讲“智能”这件事,人与动物的核心区别是什么?是语言。更具体一点来说,是对于抽象语言的理解和逻辑推理能力。
因为智能也分好多种,图像识别、人脸识别都是智能,但这种智能很多动物也具备,比如你家的狗看到你回家,会摇着尾巴欢迎你;昆虫看到花草就会飞过去;猎豹看到食物,会依靠隐蔽和速度来捕猎等等。
所以,“识别”不是人类独有的智能,语言才是。《人类简史》中有一句话,智人之所以能够成为这个星球唯一霸主,一个重要的原因是他们发展出了“虚拟”的语言。人类可以聊八卦,聊一些虚拟的事情,其实就是对抽象语言有了理解能力。比如,“今天心情很emo”、“如果我再努力一点就好了”等等。
动物也有语言,但它们交流的都是“非虚构”语言,往往是属于或者部分属于事实,比如“河边有只狮子”、“前方有颗大树”等等。所以,只有“虚拟”语言,才是人类所独有的,也就是所谓逻辑。也是我们智能的最高阶体现。
但语言到底是个什么东西,其实人类自己都没有研究清楚。
前几天,我跟清华大学脑科学家刘嘉教授对谈,他说曾经有专家老师把人类语言学的所有规律都总结了一遍,你只要掌握规律,就可以轻松学会一门语言。但ChatGPT出来的时候,根本没有去学这套规律,而是直接自学,就掌握了多国语言。
我们总结的那套主谓宾定状补,真的是语言的核心规律吗?这不好说,也没办法证伪。
有本书叫《大数据时代》,讲的是谷歌翻译团队,最早是由语言学家和工程师组成。但翻译效果一直上不去,后来开掉一个语言学家,翻译效果就好一点,再开掉一个语言学家,翻译效果又好一点。后来,语言学家全开掉,只剩下工程师们,谷歌翻译终于好用了。就算工程师都不认识阿拉伯文,但翻译效果一样好。
还有一个故事,就是图灵测试。图灵是一个非常伟大的科学家,他在100多年前就提出了这样一个实验理论,如何判断一个机器有没有人的智能?他想到了一个极简单的测试方法,就是在黑屋里放一个计算机,让人在不知情的情况下,跟计算机聊天。如果超过30%的成年人认为一起对话的是真人,那就说明计算机有了智能。
所以,ChatGPT看上去是一款聊天软件,但它真的像人一样完成语言进化,拥有了对抽象语言的理解能力。区别于只能完成机械指令的传统AI,ChatGPT能像真人一样聊天,有了智人才拥有的高阶智能。
另外,人工智能攻克语义理解的难度,是远高于图像识别的。虽然在理论学上,图像识别更需要底层能力,也就是deep learning(深度学习)。但从工程学上,最早斯坦福的两个研究生用一台GPU电脑,就把人工智能的图像识别能力提高了十几个点,开创了一个新的时代。
这次OpenAI花了6年时间、烧了20亿美金,才让计算机理解了人类的语言。在这之前,语义理解就是一条漫漫无尽的路,谁也不知道这条路还有多长。
《奇点临近》中说,2035年会出现硅基生命超越人类实现永生,以前我觉得这本书完全在胡扯,因为语义理解很难突破,以前对人工智能的总结是,“有多少人工,就有多少智能”,很绝望。
但没想到ChatGPT出现了,语义理解被攻克。这也意味着,AI已经睁开眼,可以对这个世界进行对话了,AGI(通用人工智能)开始出现。
那ChatGPT是如何掌握人类语言的呢?我们再到原理层看一下。
语义理解的两条技术道路:“教育”神经网络和神经网络“自学”。
“教育”神经网络:
即按人类对语言的理解,“教育”神经网络语法结构和知识图谱。
这更符合我们对语言学习的逻辑理解,像人族学习外语,投入就能见到效果。绝大多数互联网公司开发AI时,都会选择这条路,试图“教会”AI理解各种逻辑和规则。但问题是,系统达到一定语言能力后(远低于人),无论如何优化,依然有大量的问题的回复完全是答非所问。
神经网络“自学”:
是让神经网络学习足够多的文本,自动发现文本之间的规律。这就是OpenAI训练 ChatGPT的方式,没有严格的理论支撑,而且非常费钱,但没想到最后成功了。ChatGPT通过对海量文本的学习,自动构建了一个含有千亿参数的大模型,建立了对这个世界基本的逻辑认知,由此产生了基于逻辑的推理能力。
而在ChatGPT-3.0出现之前,OpenAI简直就是硅谷的笑话,很多人觉得就是一群神经病,烧着钱做一些费力不讨好的事情。结果没想到,AI自学语义这条路居然走通了,ChatGPT-3.0出来后,全世界都震惊了。
为什么之前ChatGPT一直不够智能?是因为投喂的数据还不够多。在我跟刘嘉教授的那场对话中,他也说道,ChatGPT的进化和我们人类大脑的进化有异曲同工之处。从动物进化到智人,花费了大约300万年,在此期间,人类大脑体积增加了三倍。而ChatGPT的突然开悟,也是因为人工智能被扩大了“脑容量”,参数增加到1000亿,就产生了智能。
另外,刘嘉教授一位在OpenAI工作的朋友告诉他,如果重新回到2017年,重新去搞大语言模型,未必能搞出现在的ChatGPT。
所以我们现在多用一个词,叫“涌现”,什么叫涌现?我们也不知道为什么ChatGPT突然“开悟”,只是把大量的文本信息灌给它,量变产生质变的情况下,它就开口说话了。所以,能造出涌现这个词,我觉得这也是人类语言的厉害之处。
由此,我们再来看看ChatGPT回答原理:当用户键入一段话,系统会根据这段话形成一个数学表达式去和大模型里的参数做匹配,产生关联概率最大的一个词,然后再以这个词和上面那段话继续以上过程。(注:所谓参数,简单理解,就是词和词之间的概率关系。)
基于以上原理,GPT的回答都是即时生成的,不是拷贝和组合。
而OpenAI创始人有一次做访谈,也说训练ChatGPT的原理,就像读一本侦探小说。根据提示和关键信息,不断地推理、推翻,再推理,再推翻,直到最后结尾,真相才公布天下。
所以,训练ChatGPT,就是给它提示词,让它自己找文本之间的联系。你要做的,就是不断用提示词训练它,比如第一个回答完全答非所问,你要不断引导提问,直到答案逐渐接近,最后完全符合你的需要为止,它就记住了。
这个原理听起来很容易,但每次推翻再来,它的答案是要不断进化的。
所以,ChatGPT的强大,不仅需要技术和勇气,还需要很强的迭代能力。
二、我们该如何看,
ChatGPT带来的变化?
ChatGPT是第一款理解了人类语言逻辑的AI,通过文字理解了这个世界,拥有了推理和创造能力。
ChatGPT出现之前,对话系统更像鹦鹉学舌,虽然能够部分匹配内容,但是系统并不完全理解具体的含义,所以同一个问题换种说法,AI就会答不上来。而ChatGPT出现以后,对话系统是建立在对语义理解的基础上的,尽管也会说错,但都是“一本正经”的胡说八道。
当然,新事物出现都不是完美的,就像汽车刚出来没有马车跑的快,iPhone刚出来没有诺基亚好用。但底层范式的变化才是关键。一本正经的胡说八道,重点在一本正经,而不在胡说八道。一本正经说明他的逻辑是正确的,胡说八道可以通过专用系统来矫正(plugin)。
所以说,ChatGPT的出现意义重大,因为,它带来了交互革命和生产力革命。
1.交互革命
当AI可以听得懂人话,这就说明,以自然语言为交互界面的时代终于到来了。
人机交互界面将以自然语言为主,那么我们所有的设备、所有的工具,都可以重新做一遍,真正实现机器围着人转。而在这之前,我们大量的工作都是人围着机器转,比如,你要使用电脑,需要懂输入法,以及电脑的基本操作技能,才能让它运转。但这一次,是机器理解了你的语言,人只要下达命令,它就会为你提供服务。
比如,你想写一段编程但又没时间,可以让它帮你写,你晚上六点回家,想吃外卖,也可以让它帮你提前点好,安排送达等等。也许以后靠一部手机,仅用语音操作,就可以完成所有事情。
2.生产力革命
聊天只是ChatGPT能力的一个demo,大模型的本质是逻辑和推理能力,这种能力可以在任何需要脑力活动的地方发挥作用。这意味着,人工智能创造和创新的时代来临了。
我们知道,今天整个社会最重要的生产力是什么?是脑力劳动。而ChatGPT的出现,是人类第一次将电能转换成通用智力。这种能量转化,是区块链、元宇宙、互联网这些重塑生产关系的变革都没法比的,因为ChatGPT带来的是生产力革命,它诞生的意义不亚于蒸汽机的出现。
蒸汽机把热能转换成动能,人类由此进入工业化时代,生产力大幅度提升。而ChatGPT的出现,是将电能转换成了脑力和通用智力,增加了脑力劳动的不断输出。就如同你一插上电,就有了无数员工。
我记得有一次,我发抖音,说ChatGPT将带来生产力革命。底下有人评论说,你说生产力革命,那它会挖地吗?我说它不会挖地,但它可以跟挖掘机打通,更有规划和效率的去挖地。而且它不会停歇。
这就是生产力革命。今天硅谷的创业公司都发生了很大的组织结构变化,以前硅谷早期创业公司都是把钱用来招人,但现在钱一半用来招人,一半用来购买算力,以及各种与GPT相关的服务。
所以,马化腾以前认为ChatGPT是十年一遇的机会,现在认为是百年一遇的机会。
那大模型真的会颠覆人类?未来统治一切吗?目前来看,还不会。因为ChatGPT还没有生成意识,也没有好奇心和主动性,它所有回答都是根据人的提问,按照概率算出来的。它不会对写一堆代码感到难受,也不会对受制于人感到痛苦,这些个性和自我意识的东西还没有显现。所以,它还是一堆冷冰冰的代码。
也许ChatGPT以后会超越人类,统治一切。但目前来看,这些弱点还需要很长时间攻克。
所以,大模型的这些弱点,正好是我们的创业机会。
那未来行业会发生哪些变化呢?
第一个,就是大模型的核战争。我认为所有大公司都会参与到这场核战争中,他们会不断烧钱加码造出自己的大模型,因为大公司谁没有自己的大模型,就要被淘汰。
有很多人问,中国的大模型跟ChatGPT还有多大差距?其实没有太大差距,一年内基本可以追上,因为它的创新来自于公开论文,而且GPT-2.0已经开源了,一旦有人证明这件事可做,中国团队追起来的速度会非常快。
第二个,是平民化大模型。我相信,这会是大多数中小型公司的选择。因为大多数中小型公司的产品,不需要1000亿参数,也不需要爱因斯坦,只需要在特定场景下够用就行。比如做一个博物馆讲解机器人,100亿参数就可以了。
第三个,效率大提升,所有公司一定会产生巨大的组织变革,组织形式都会发生变化,效率将被极大提升。
第四个,陪伴和生成内容,互联网范式会发生变化,互联网的核心叫做连接信息,各行各业都将被深刻影响,“生成内容”将替代“链接信息”。
第五个,脑力劳动者将迅速被AI替换,技术、经验、创造力的壁垒将大幅度弱化,有任何问题都可以请教ChatGPT,它甚至会一步步引导你,掌握多个技能。
以前是五年一小变,十年一大变,现在可能一两年就会发生很大的变化。就像蒸汽机出来后,汽车代替了马车,马车夫就失业了。而ChatGPT出现后,人工智能最先替代的会是一些脑力劳动者,尤其是中间层的脑力劳动者。
比如,我有一个朋友,以前他的游戏公司,1000多人有300多人的美术团队,但ChatGPT来了以后,300多人的美术团队,基本上都被裁掉了。
这次大模型带来的变革,整个社会的发展可能会产生翻天覆地的变化。包括我自己,心态上也产生了很多变化,我们每个人都想在里面做些什么。
未来每个人该怎么办?还是要保持好奇心,主动学习。
那天问完我们家的狗为什么叫三万后,第二天送孩子上学,突然我就迷茫了。之前养孩子我都很佛系,觉得孩子爱干嘛就干嘛,只要愿意学就行。结果现在我迷茫了,孩子应该学什么,未来才不会被取代呢?
后来我想通了一件事,至少人类还有好奇心,还有主动学习和开放的心态。未来技能很快会被替代,但好奇心、主动学习能力、行动力是不会被替代的。
有一本书叫《正念领导力》,这本书,对我个人和我们组织帮助都很大,在此推荐给大家。
另外,行业创业者该怎么办?可以参考以下4个方向:
1.认真学习:认真学习ChatGPT和相关AIGC产品,不学习者必然成为马车夫;
2.熟练驾驭:熟练驾驭AI产品,成为新时代的魔法师;
3.保持热情:发挥人族的优势,保持热情、好奇心和想象力,脑洞目前还是优势;
4.千万别躺:千万别躺,生产力革命的年代,睡觉都是浪费时间。
因为AI向前发展一定是必然,技术变革任何人都阻挡不了。所以最好的建议,就是去学习新知识,留恋是没什么意义的,每个马车夫都该去学习开汽车,你要成为AI的驾驭者,而不是被它替代的人。
三、未来,创业者的机会在哪里?
那么,大模型时代,创业者的机会在哪里?我认为也有四个方向:
第一种,大模型直接用。你技术特别牛,拿大模型直接去做二次开发,但是对于非科技企业,也比较困难,因为要与程序员沟通,没有沟通语言;
第二种,基于大模型的工具产品,直接用。这是很多科技型公司在做的,各个行业像一些电商等企业,就适合直接采购科技公司提供的B2B服务;
第三种,私有化大模型。比较适合中小型企业,可能不需要很强的“大脑”,但能够处理特定场景需求,保证数据安全性就行,这类企业很适合定制自己的私有化大模型;
第四种,自研大模型。更适合资金、技术雄厚的创业者选择。
为什么互联网大厂一定会卷入自建大模型?因为大厂不可能将自己的核心数据接入ChatGPT,这会削弱他们的数据壁垒和核心竞争力,就像腾讯不可能把微信聊天信息交给百度,美团也不可能把外卖数据交给抖音.....所以说,未来互联网巨头的核心武器,一定来自大数据。
为什么要做私有化大模型呢?因为通用大模型,比如ChatGPT,会更加适用于广泛C端用户的碎片化需求,但对于B端企业而言,想要更符合企业调性、深度需求的产出,就会差点意思。
另一方面是数据隐私安全问题。模型微调、AI训练过程中的任何相关数据都有可能留存在公域大模型数据库中,但对于企业来说,许多私密数据并不能在给到公域大模型的ChatGPT来做训练,所以,一般企业会选择建立自己的私有化大模型。
目前,大模型已经是各个大厂的必争之地,而建立中国版“OpenAI”不仅需要勇气,还需要绝对的技术和资金实力。
对于没有雄厚技术和资金的中小企业,未来该怎么办呢?这也是我们最近一直在考虑的方向。猎户星空的基于大模型技术的企业服务产品“聚言”(chatmax.ai),主要针对中小企业解决数字员工以及大模型等难题:
一是把大模型包装成工具产品,依据不同的行业知识和工作流程,为企业解锁客服、导游、财务分析师、法律顾问、合同审核员等不同领域的专家级数字员工;另一个就是基于底层技术,为一些中小型公司提供私有化大模型,比如垂直行业的大模型或者特定应用场景的大模型,几十亿、几百亿参数就可以搞定。
从“聚言”(chatmax.ai)的技术原理来看:企业可基于公司业务数据、专业领域知识、私有信息等完成大语言模型的训练,比如律所需要具备全面的法律知识,财务需要专业的财税知识等,员工以自然语言描述完工作任务,大模型基于企业的业务流程,对交代的工作任务进行理解、规划,最后完成执行。
目前,猎户星空在AI机器人领域深耕六年,已经具备五大优势:
猎户星空可以帮助千万中小企业打造专家级数字员工,让企业更高效。
在这百年一遇的生产力大变革时代,让我们一起去大力拥抱AI 2.0!谢谢大家。
特别声明
以上所刊登的文章仅代表作者本人观点,本公众号为非营利性平台,刊发文章仅作学术交流使用,不构成投资决策之建议。
对本公众号原创之文章,如需转载或引用该等文章的任何内容,请私信沟通授权事宜,并于转载时在文章开头处注明来源于公众号“经济学原理”及作者姓名。未经本公众号授权,不得转载或使用该等文章。
对非本公众号原创之文章,任何商业运营公众号如转载,请向原创公众号或/及原出版机构申请许可。