GPT癫狂100天:热钱、边界以及“回不了头”
全文共6286字,阅读大约需要18分钟
当人工智能逐步失去“边界”,仿佛AIGC是一个潘多拉魔盒,既然被打开了,就不会只放出一种影响。
记者丨杨月涵
编辑丨林琴
2015年,特斯拉CEO马斯克的首部授权采访传记在美国面世。传记的开篇记录了一场晚餐,在那场晚餐里,让马斯克面对作者打开话匣子的,不是特斯拉,也不是SpaceX,而是人工智能。马斯克称,令他恐惧到睡不好觉的事情,就是谷歌创始人里拉·佩奇正在建造的人工智能机器人大军可能摧毁全人类。
传记出版的那一年,马斯克与一众人共同创建了OpenAI,目标是制衡谷歌,避免人工智能“灭世”,单是马斯克个人的出资就达到了1亿美元。
如今,OpenAI搞了个大动作,马斯克却早就与之分道扬镳,并站在了其对立面。马斯克炮轰OpenAI,称AI开发者正陷入一场“失控的竞赛”。
与马斯克相反,中国的互联网圈、创投圈正为之兴奋不已。4月10日,搜狗公司创始人王小川5000万美元带资进组,成为继美团联合创始人王慧文、创新工场创始人李开复之后又一名加入大模型“诸神之战”的互联网猛将。
大厂更不能缺席,市场先后传来百度、阿里、华为入局大模型争霸赛的消息。一时间,创业圈你追我赶,资本市场狂欢,投资摩拳擦掌。
在过去的100多天里,ChatGPT卷起巨大的风暴。由此引申的是技术、产业进步带来的新矛盾——大模型的不断迭代,应用场景的不断丰富,当人工智能逐步失去“边界”,仿佛AIGC是一个潘多拉魔盒,既然被打开了,就不会只放出一种影响。
油门刹车,踩哪个
如果以ChatGPT为关键词在百度指数上进行搜索,这条来自互联网的曲线就会清晰地告诉我们,这波AI的浪潮正式成为爆点的时间,是今年2月8日。当天,ChatGPT搜索指数达到849565,至今仍未被超越。
那一天发生了什么?当天凌晨,微软正式发布整合了ChatGPT系统背后技术的新版必应搜索引擎,人们认为,这是微软多年来距离超过“搜索之王”谷歌最近的一次。傍晚,“阿里版”ChatGPT正处于研发中的消息不胫而走。再加上此前一天谷歌Bard和百度“文心一言”的预告,积累下来的讨论彻底引爆了ChatGPT的话题。
如果说在这之前的一个多月里,ChatGPT的热闹更多属于圈内人,那么重量级玩家的相继入局,则成了ChatGPT正式出圈的关键推手。
很快,人们就意识到这只是一个开始。5天之后,王慧文高调入局,一封“AI英雄榜”炸开创投圈。3月15日,抢在百度文心一言发布的前一天,OpenAI正式推出GPT-4,OpenAI CEO山姆·奥特曼直言,“这是我们迄今为止功能最强大的模型”。
再后来,重磅的消息像是下饺子,一个接着一个。“华为盘古大模型4月发布”的传闻还没落定,4月7日,阿里云官宣大模型“通义千问”邀请测试的消息再度震撼市场。
与此同一时间线运行的,还有大厂人纷纷投身AI大模型创业大军,越来越激烈的人才争夺战,以及越来越多的企业透露AI领域的布局。
“AI的iPhone时刻。”不久前,在英伟达2023年GTC大会的主题演讲上,其创始人黄仁勋用这样一句描述概括了当下的现状。英伟达给这场大会定下的广告语是:“切勿错过AI的决定性时刻。”
许是树大招风,当巨大赞誉出现的同时,“人类威胁论”尚未产生实效,一场监管风暴却已经率先成型了。3月的最后一天,意大利出手禁止使用ChatGPT。一周之内,德国、法国、爱尔兰、西班牙等欧洲国家的监管机构也相继表达了考虑暂时禁用ChatGPT的可能性。
在这之前,一份超过1000名科技领袖和研究人员联名的公开信,更是呼吁所有AI实验室立即暂停训练比GPT-4更强大的AI系统至少6个月。信中写道,“广泛的研究表明,具有与人类竞争智能的人工智能系统可能对社会和人类构成深远的风险”。
马斯克正是联名者之一。
诱导自杀、教唆犯罪的苗头也已经显现。随着公开信和“封杀令”的接踵而至,ChatGPT也好,AIGC也罢,忽然有了种“欲戴王冠,必承其重”的隐忍和复杂感。
“边界”在哪儿
“AI一定会产生自我意识,留给人类的时间不多了。”这是360集团创始人周鸿祎的判断。他将AI意识的产生类比人脑意识的产生,人类脑容量里神经网络连接数大概是100万亿,当大模型的参数到达10万亿时,意识可能就自动产生了。
AIGC可以看作是AI算法的一次重大突破,朝着重构人类生产力和生产关系的方向变革,AIGC产业又可以大致分为基础大模型和应用两个层面。
底层大模型的性能基础,直接决定了AIGC的上层建筑。公开资料显示,CPT-1到GPT-3的参数分别为1.17亿、15亿及1750亿。OpenAI尚未公布更多关于GPT-4的数据信息,但《纽约时报》曾提到,GPT-4学习的数据规模要比GPT-3.5大得多。
当下所有关于ChatGPT甚至AIGC的恐惧和不安,最终都能汇聚到这个底层建筑的“失控”,在业内,人们把这种失控称之为“不可解释”。
元语智能联合创始人兼COO朱雷表示,当下国内外一个普遍的担忧就是,AI是否会完全取代人类,这背后的原因在于,模型本身是不可解释的,包括OpenAI的很多算法工程师,都无法详细地推理出来,这些大量的参数为什么会产生这样的效果。
“这其中没有强大的科学依据,也没有比较好的测评方法,这意味着模型本身无法从各个维度上设置指标,进而去控制模型减少风险的存在。”朱雷称。
据了解,元语智能孵化于中文NLP开源社区CLUE,该社区成立于2019年,是第一个大规模的中文语言理解标准评价体系,朱雷也长期从事NLP自然语言处理领域的模型和算法工作。
在朱雷看来,暂停大模型研发的呼吁,就是为了想办法去研究大模型为什么会有这种强大的能力,只有找到答案,才能在未来研究下一代人工智能系统的时候,知道如何去做监督,否则监督就会远远落后于大模型的进化速度。
“白纸黑字”和“有图有真相”的时代规则,也被AIGC彻底打破了。
瑞莱智慧孵化自清华大学人工智能研究院,致力于贝叶斯深度学习、AI对抗攻防等第三代AI技术的研究,其联合创始人萧子豪提到,ChatGPT能力升级下,伪造成本和难度将变得更低,而且这类内容难以分辨和追踪,治理难度也更大。
ChatGPT只会给出整合后的单一回答,对普通人来说,除非自身知道答案,否则很难判断它是不是在“胡说”,或者用户自己通过其他可信渠道去进行验证。这也是目前ChatGPT在信息准确性方面最为诟病的一点。
萧子豪称,技术方面,有一些方法被提出,比如针对合成文本的鉴别、数字水印等,但还存在难点。因为机器与人类撰写的文本差异性特征较少,真人说话的方式也可能是多变的、结构有误的,因此很难单纯从文本本身就鉴别出是否由ChatGPT生成。另外,数字水印需要ChatGPT在生成内容时即添加水印,需要考虑到技术实现问题。
除了虚假信息、数据泄露,北京卓纬律师事务所合伙人、律师孙志峰认为,AIGC的发展还会带来诸如人工智能生成内容知识产权或竞争法保护方式、知识产权权属、机器生成内容侵权方认定等问题;人工智能生成违法、违反人伦内容或产品责任追究,以及遏制扩散传播;人工智能造成部分岗位或生态灭失引发的社会及法律问题。
但孙志峰也提到,没必要因为新生某个领域而专门针对这个领域进行综合立法,可以在总结和预判的基础上,对部门法中的一些规定进行适应性修订。
AI,投还是不投
科技圈在battle技术,资本圈在battle艺术,投资的艺术。
4月10日,ChatGPT概念股忽然遭遇重挫,截至收盘下跌6.13%,创下该概念指数推出以来最大单日跌幅。云从科技、三六零、科大讯飞等集体跌停,昆仑万维、海天瑞声、蓝色光标、同花顺、拓尔思等跌逾10%。
但盘后公布的龙虎榜数据显示,科大讯飞、拓维信息、昆仑万维、景嘉微等板块热门概念股均有机构现身买入。以科大讯飞为例,3家机构现身该股买入榜前五,合计净买入1.94亿元;卖出榜上,一家机构卖出近1.25亿元,机构总体净买入近7000万元。
不久前,神农投资陈宇和东方港湾但斌在社交媒体上激烈交锋三个回合,主题依旧是AI。前者认为这次的AI行情是一次“有意义的乱炒”,但后者则坚定地认为,“这一波概念炒作,一旦被套,不知猴年马月解套”。
狂热和谨慎,是资本市场上截然不同的两种态度,也是这一波AIGC浪潮爆发下难以回避的一体两面。
狂热的一面在于,治理的挑战没能浇灭资本的热情。Wind数据统计显示,今年以来,ChatGPT概念板块成交额从160多亿元攀升至850多亿元,整个板块指数涨幅已逾50%,部分概念个股年内累计涨幅更是高达300%。目前ChatGPT概念板块整体平均市盈率高达逾130倍。
谨慎的一面在于,当市场过热,泡沫就成了人们担心的必然选择。华创证券首席策略师则在报告中称:“AIGC交易明显过热。”安信证券也在研报中表示,短期需要承认人工智能AI+数字经济(TMT)行情存在热度偏高的迹象,出现高位调整的可能性在上升。
不过从AIGC领域的投资来看,知路研修集团董事长付霖提到,目前国内还是比较冷静的,通常处于只看不投的状态,相较而言国外才更“疯狂”。付霖称,“只要是搞这个的,不管具体是做什么的,都会有投资”,“前两个月美国那边感觉是个项目都拿到融资了”。
在这之前,付霖刚刚现身于北京一场人工智能领域重点创新项目的路演活动中。早在2021年,付霖就将GPT模型应用于教育领域,进行自己企业的降本增效。目前他的企业已开发了3款基于GPT-3.5模型的教育类应用,其中一款是一个多模态测评系统,协助教师进行论文和视频答辩的自动评分。
教育被认为是人工智能落地的关键场景之一,也一度是ChatGPT引起巨大争议的场景之一。通常来讲,批改作业以及对学生作业进行评估,是占据教师教学精力非常庞大的一个部分。
香颂资本董事沈萌认为,AIGC的关键技术基础领域收益更高,但前期风险和过程时间也相对更大、更长。应用层风险小、时间周期短,相应地收益率也就更低。投资者面对国内企业时,如果对方说是做应用,比如利用这项技术来改善自己业务效率等情况,通常可信度较高,同时也符合基金投资的原则。
“但如果企业表示自己要做大模型,基本可以判定营销的成分居多。”沈萌进一步提到,对投资基金来说,国内类GPT的技术水平有一定的差距,投入不具有商业可行性。
他总结称,一些长期关注AI产业发展的基金会投相关的企业,但投资比例和总金额都不会太高,因为风险系数太大,而且太烧钱,一旦遇到不靠谱的,就有可能打水漂。另外这些基金相对来说也会对这一领域的投资持有更审慎的态度,毕竟这并不是一个划时代的技术,而是技术演进的必然结果。
如果从抽象的技术角度来看,ChatGPT似乎只是一个拥有庞大算力、可以整合海量信息的“量变”,但它所产生的所有东西都是有迹可循的,而没有实现强人工智能的“质变”,即创造出什么样的东西。它更像是信息技术发展迭代的其中一环,起到的无非是提高效率的作用,而不是一种新时代能够推动生产力跨越式提高的动力。
今年全国两会期间,国家新一代人工智能治理专业委员会委员曾毅也曾提及,ChatGPT是一个人工智能领域现有工程技术的组合创新,在用户体验上有显著提升,但并非科学的突破。它使用自然语言处理领域的几项关键技术,都是几年前学术界已验证有效、相对比较成熟的技术。
至于资本层面,沈萌认为,ChatGPT只是一个营销出来的热点,毕竟砸了这么多钱,不搞出点动静来,可能就要断炊了。
一些私募狂热的背后,也要看到问题的本质:他们是要无私地推动人类社会的进步,还是为了割韭菜?私募的利益诉求是为了变现、是投资增值,如果没有更多散户接盘,自然无法实现投资增值的目标。
国产,谁先“出道”
3月末,英特尔联合创始人摩尔去世。
人们在回顾其传奇一生的同时,也再次回忆起了那个著名的“硅谷与‘八叛徒’”的故事——1957年,摩尔与另外7名员工集体跳槽成立了仙童半导体公司,但这次“叛逃”却意外打开了世界芯片产业快速发展之路,美国加州圣塔克拉拉谷地也得以赢得了“硅谷”的称号。
这种“叛逃”逐渐被褒化成了一种叛逆传统的创业精神,如今的AIGC产业,似乎在上演一个新版“硅谷与‘八叛徒’的故事”,其中又以底层大模型最甚。
上个月,前字节跳动视觉技术负责人王长虎离职创业,方向将聚焦于生成式AI的视觉多模态算法平台,并关注视觉相关的各大垂直应用场景。
在这之前的几天,阿里前技术副总裁贾扬清也在朋友圈宣布,其和团队已从阿里“毕业”,下一站将是AI创业,方向为AI大模型底层技术相关。
一同踏入大模型创业赛道的,还有创新工场CEO李开复、前搜狗CEO王小川、前京东AI掌门人周伯文、出门问问创始人李志飞等人。
4月10日,王小川官宣了他的AI大模型公司“百川智能”,目前已获得5000万美元启动资金。此外,公司将会在年底发布to B领域的大模型产品。王小川说:“追上ChatGPT水平,今年内可能就能够实现,但对于GPT-4或者GPT-5,可能需要三年左右的时间,应该不会低于两年。”
有人创业,自然有人深耕,资金实力雄厚的大厂,没一个甘愿落得下风。3月16日,号称“ALL in AI”了几年的百度终于推出文心一言大语言模型。
百度创始人李彦宏给百度全员写了一封信说:“中国AI市场即将迎来爆发性的需求增长,其商业价值的释放将是前所未有的、指数级的。百度作为中国人工智能市场长期增长的最佳代表,正站在浪潮之巅。”
自此,中国大模型竞赛按下“加速键”。3月下旬,尽管没有官方认证,华为盘古NLP大模型的消息却忽然走热。几乎是同一时间,三六零创始人周鸿祎在一场演讲中首次亮相了360大语言模型产品。网友戏称,“红孩儿”出世了。
4月9日晚些时候,360传来了最新消息:基于360GPT大模型开发的人工智能产品矩阵“360智脑”率先落地搜索场景,将面向企业用户开放内测。
4月7日,阿里云官宣大模型“通义千问”邀请测试,但截至北京商报记者发稿,该内容显示已被发布者删除。紧接着,京东集团副总裁何晓冬也在一场论坛上表示,京东将在今年发布新一代产业大模型,言犀是“京东版”ChatGPT。
朱雷称,AIGC产业主要分为三层架构,底层做通用大模型,属于基础设施的能力层,类似于OpenAI以及谷歌的Bard等。
中间层中的一种类型是本身不做大模型,而是一个集成平台的架构,底层封装一些已有的模型,或在已有模型上做指令微调,另一种可能会做一些推理的AI框架,实现对模型训练和推理过程的优化。
最上层的就是一些行业解决方案或者说是一些应用,包括微软的copilot以及国内外很多演化出来的App和网站等。
从技术角度上看,大模型可以简要地理解为一个基于Transformer架构,以大量数据及上亿参数做训练的语言模型,其中蕴含着理解的模块,也蕴含着生成的模块。理解和生成,也是大模型中最重要的两个部分。
大模型本身可以形象地看作互联网,我们在操作电脑的时候,更多是在使用应用,很多IP协议层、操作系统运算的过程,用户是不知道的,目前大模型就处于这个状态。也就是说大家在想办法搭建整体的AI产业基础设施,在这个基础上慢慢形成一些好的应用或者商业模式。
朱雷认为,目前国内的大厂更多出于一种通盘的考量,一开始就做一个非常通用非常强大的基础设施,但技术路线还没有确定,因此国内到底谁能做成通用的基础设施,很难在一年内得出结果,可能要3-5年的时间才能有一个初步的判断。
而且通用的大模型解决不了具体行业的问题,尤其是在国内,大部分高质量中文语料都在行业内,而不在公域的互联网内,即便是大厂也很难拿到行业数据。从这个角度上看,专用的模型在特定领域的效果一定要比大公司的通用模型更合适。
朱雷预计,未来通用的大模型大概会有3-4个,行业领域很可能就会百花齐放,具体到每个行业,也可能会有1-2家比较优质的大模型领跑。
在朱雷看来,目前国内大模型其实远没有到泡沫的阶段,做大模型的总共也就几家企业,之所以会给大家造成这样的印象,是因为一些重量级玩家的加入,将事情本身夸张化,国外一些新的热点也会营造出一种市场爆发的错觉。
“但今年四季度,随着玩家越来越多,不排除出现第一个泡沫的可能性。”朱雷称。
付霖也认为,未来AI可能会涵盖所有的行业,从一个比较扁平的大模型发展到每个领域都出现垂直的应用和机器人。虽然目前出现了一定的混乱,但当有更多的条规对其进行约束时就会好很多。
“我们可以将其理解为时代的车轮已经开始转动了,中途不可避免地会遇到一些小石头,但都不可能阻挡车轮整体的转动。”付霖称。
图片丨壹图网、东方财富截图、百度指数截图、李开复朋友圈截图、新浪微博@周鸿祎 截图、OpenAI官网等