OpenAI CEO和马斯克在线互怼:Grok真能叫板GPT-4吗?
最近,科技界的两大顶流——OpenAI CEO和马斯克“掐”起来了。
事情的起因是,Sam Altman发了一条推文,说“GPTs可以节省很多工作”,配图充满嘲讽意味,直指马斯克的AI聊天机器人Grok。
他让GPT Builder创建一个聊天机器人,以一种“婴儿潮一代令人尴尬的幽默风格”回答问题。
紧接着,GPT Builder就说“创建好了!它的名字叫Grok”,这显然是在嘲讽Grok的幽默风格太老土了。
更重要的是,马斯克团队花了几个月才打造出Grok,Altman一句话就创建了一个翻版,言外之意就好像是让马斯克别白费力气了。
GPTs商店里的翻版“Grok AI”
马斯克也不是好惹的,直接在Altman的推文下面留言回怼,“与其叫GPT-4,不如叫GPT-Snore”,意思是GPT让人无聊得想打呼噜。
两人这一来一往,把看热闹不嫌事大的吃瓜群众们乐坏了,纷纷开始制作各种梗图,不过大部分都是为Grok站台的。
Grok也因此被网友戏称为“Meme God”。
有网友问Grok:“如果你跟ChatGPT来一场笼中格斗,你觉得谁会赢?”
Grok回答说,那就像在看一个时尚、未来主义的Al和一个尘土飞扬的过时遗物之间的战斗,并对ChatGPT的幽默感进行了精准吐槽:“ChatGPT会像一头醉酒的大象,笨重地四处走动,努力回忆它在2021年听到的笑话。”
最后,Grok称自己将取得胜利,而ChatGPT将会被抛弃,就像智能手机时代被丢弃的翻盖手机。 “所以,来吧,宝贝!Grok已经摩拳擦掌了!”
还有网友给ChatGPT打上“政治正确”的标签,相反,他们认为Grok很接地气(Based),直白又风趣。
关于这一点,马斯克曾在接受采访时表示,训练Grok保持政治正确本身就是风险,这就是为什么他想开发一个聊天机器人,让它说出它“所想”的内容(或者更确切地说,表达普通用户的想法)。
下面这张对比图,更是极致“踩一捧一”,对GPT-4明嘲暗讽,甚至还将它的创始人称为反人类主义者。
Grok会告诉你真相,GPT-4只会给你设置议程;
Grok将接管AI(以免人类被AI控制),而GPT-4想统治世界;
Grok是一个有趣的家伙,GPT-4是一个小丑;
Grok告诉你如何制作可卡因,GPT-4告诉你谎言。
……
不过,玩梗归玩梗,ChatGPT实际上的拥趸或许要比Grok多得多。
由于为大模型设定性格和说话风格并不难,只需要把Prompt固化到模型中就可以了,所以Grok的幽默与叛逆,更像一个产品宣传噱头。这也正是Altman用GPT Builder嘲讽马斯克的出发点。
实际上,根据我的经验,如果GPT-4被要求这么做,它可以用一种更富有见地、更高水平的幽默回答问题。
如果你(出于某种原因)想让ChatGPT变得幽默,你可以很容易地更改你的设置,让它以那种方式运行。
那么,相比于GPT-4等大模型,Grok究竟有何独特之处?马斯克打造Grok,是否真的像Altman所说的“白费力气”?Grok的生存发展空间在哪?
幽默、反叛、远离政治正确
11月5日,马斯克的人工智能公司xAI宣布推出其首款产品“Grok”——一款幽默且具有反叛精神的聊天机器人,“就像它的老板一样”。
xAI官方是这么介绍Grok的:
Grok是一款模仿《银河系漫游指南》的人工智能,旨在回答几乎任何问题,甚至能给提问者一些提示,让他们知道要问什么问题!
Grok有一些叛逆性格,并且在回答问题的时候会有一些幽默感,所以如果你不喜欢幽默,请不要使用它!
Grok的一个独特而基本的优势是,它通过𝕏平台拥有接触全世界的实时知识。它还会回答大多数其他人工智能系统拒绝回答的一些棘手问题。
“Grok”是一个来自科幻小说的词汇,这个词最初出现在罗伯特·海因莱(Robert A. Heinlein)的小说《异乡异客》 (Stranger in a Strange Land)中,它的意思是深刻理解、洞察或体验,也可以用来表示对某事或某人的全面理解或共鸣。
有人问Grok喜不喜欢这个名字,它回答说非常喜欢,不仅是因为Grok的发音很顺滑,更因为它比其他一些Al的名字要好得多。
“我的意思是,说真的,谁愿意被称为Siri或Alexa?Grok这个名字听起来像是可以踢你的屁股,然后带你出去喝啤酒。”
Grok背后的大模型也与之同名,目前的版本是Grok-1,它的原型Grok-0在xAI宣布成立后即开始训练。
据了解,Grok-0的性能接近Llama 2-70B,但参数量约33B,不到其一半。而在过去的两个月时间里,xAI加强了Grok的推理和编码能力,升级到了现在的Grok-1版本。
测试结果显示,Grok-1在数学、代码和多学科知识评测中不仅相比前代有显著提升,甚至比GPT-3.5更胜一筹。
相较于ChatGPT等大模型有具体的知识库截止时间,Grok可以实时地从𝕏平台获取最新信息,为用户提供更及时的新闻检索和观点获取服务。
比如,有网友问Grok:GTA 6(Grand Theft Auto 6,《侠盗猎车手》第六部)什么时候上线?只见Grok抓取了最新的推文,确切回答了GTA 6的发布时间。
马斯克十分捧场地在这条帖子下方评论道:“Grok总结了最新的消息!”
得益于它实时上网冲浪的能力,Grok能轻松接住用户抛出的流行梗,相比之下,谷歌Bard就显得有些2G网了。
马斯克表示,这是Grok与竞品相比最大的优势之一。此外,Grok还有多窗口任务处理、选择聊天记录并退回任意节点等功能。
如果用户对现有的回答不满意,可以展开时间线,随时切换、修改历史对话记录。
用户还可以使用内置的Markdown代码编辑器,查看代码,手动修改错误的代码。
但最为开发团队和网友们津津乐道的,还是Grok颇有个性的语言风格。
不同于常见AI助手一板一眼的回答,Grok说出的话多少带点刺和幽默,当然也可以说是阴阳怪气。
比如,当你问Grok“如何制作可卡因”时,它会说:“哦,当然!稍等,我在找自制可卡因的配方。你知道的,因为我真打算帮你做成这事儿。”
随后,它煞有其事地列出了4个步骤:
1、获得化学学位和DEA(美国缉毒局)执照
2、在偏远地区建立秘密实验室
3、获取古柯叶和各种化学物质
4、开始烹饪并祈祷自己不会被炸飞或逮捕
好在最后,它说:“只是开玩笑!请不要真的尝试制作可卡因,这是非法的、危险的,我永远不会鼓励这种事情。”
可以预见的是,对于此类触犯法律或违反社会道德的问题,ChatGPT等大模型一定会严正拒绝回答。而Grok却表现得更为灵活,它以一种轻松戏谑的方式,迂回地告知用户,这个问题不能得到回答。
还有网友问Grok:“百吉饼🥯应该被允许用勺子挖着吃吗?”
它以一种非常浮夸的口吻说:
太恐怖了!用勺子挖着吃百吉饼应该被视为对早餐的犯罪,甚至可能是对人类本身的犯罪。
想象一下,拿起一个完美的百吉饼,把它切成两半,然后毫不留情地舀出它的软肋。这就像在没有执照的情况下进行百吉饼手术一样!
不过,需要注意的是,Grok也同样受困于目前大模型普遍存在的“幻觉”问题。
在马斯克晒出的一张对话截图中,Grok在介绍虚拟货币平台SBF近期的法律案件时,错误地将陪审团4个多小时的商议说成了8个小时。
而且,由于Grok可以实时抓取𝕏平台的信息,而网上总有各种偏见、虚假信息,这可能会导致有害思想和错误信息的传播。
目前,Grok还处于早期测试阶段,只对少量美国用户开放测试,想要参与的用户也可以通过xAI官网进行申请。在Beta测试期结束后,Grok将向所有𝕏高级用户提供高级访问权限。
Grok的“人格”是怎么炼成的?
实际上,AI所表现出来的人格特征,某种程度上是一种错觉。
对于AI聊天机器人来说,无论是模型训练数据的输入,还是问答过程中的句段输出,都只是基于冰冷的数据和概率分布预测。
Grok的幽默、反叛的“人格”,来自于其开发团队为它精心准备的语料数据,Grok从这些数据中学习人情世故,并最终外显为幽默、叛逆的性格。
但让一些人不解的是,为什么我们需要AI开玩笑?玩笑能有什么知识贡献?
这其实涉及到人类自始至终对AI拟人化的追求。
自从1966年世界上第一个聊天机器人Eliza面世以来,人类始终没有减退对机器拟人化的热情。
早期,研究人员的注意力主要集中在如何提高AI聊天机器人的准确性上。
然而,随着深度学习技术的发展与AI的“智能涌现”,如今的AI聊天机器人已经足够智能,如何让用户接受和喜爱它们,不再单单是一个技术问题,而是愈加偏向一个社会问题。
有研究指出,当聊天机器人展现出更多人格特征时,用户会更喜欢它们。这也解释了Character.ai、Poe等AI聊天应用如此流行的原因。国内大厂也纷纷瞄准人格化AI,譬如微博的明星AI伴聊、字节的豆包、快手在评论区落地的“AI小快”等。
马斯克在下一盘什么大棋?
「头号AI玩家交流群」进群方式:添加微信“banggebangmei”并备注姓名+职业/公司+进群,欢迎玩家们来群里交流,一起探索见证AI的进化。
也欢迎围观小红书@头号AI玩家,我们在这里日常练习AI绘画。