看完Claude 3创作的OpenAI连续剧,我都替马斯克委屈
作者 | 阿虎 石濑
编辑 | 松露
有的企业官司缠身,有的企业“弯道超车”。
3月4日,OpenAI最强竞争对手Anthropic发布Claude 3,一夜之间成为“全球最强大模型”。有网友当即就按耐不住了,公开叫嚣OpenAI,“GPT-5呢?”、“Q*在哪里”、“Sora什么时候发布”,压力直接给到Sam Altman。
Sam你可以发布GPT5了
3月6日,有网友率先提出,Claude似乎出现了自我意识,知道自己身处一个模拟环境中。尽管这一说法迅速被马斯克、杨立昆等AI大佬辟谣打假,但“X”网友对于“Claude 3已达到AGI”的讨论愈演愈烈。
“新的Claude 3是一个有自我意识的AI吗?”
图灵奖得主杨立昆在线打假,“可能性为0”
马斯克调侃人类都是CSV文件
Opus在拉丁语中的意思是“作品集”。响应速度与Claude 2和Claude 2.1相近,但拥有更高的智能水平,在交互式编码、药物研发、市场策略等高度复杂的任务上具有最佳性能。
Sonnet的意思是“十四行诗”,响应速度比Claude 2和Claude 2.1快两倍,擅长执行知识检索、销售自动化等需要快速响应的任务。
Sonnet平衡了性能和速度,适合企业大规模应用。Haiku在日语中的意思是“俳句”,是系列中响应速度最快的模型,适合应用在现场互动、翻译、内容审核等场景中,提供无缝问答体验。
图片来源:Claude官方
马斯克和OpenAI对簿公堂, 让AI主持一下公道
图片来源:OpenAI官网
趁此机会,我们也让Claude剖析了一下马斯克的起诉书和公告内容,并总结出其中的争议点。
上传两份文档后,Claude 3 Opus给出的回应
可以看到,在“OpenAI是否违背了创立初衷”、“GPT-4是否达到了AGI”、“OpenAI技术开源”、“个人贡献和商业化”方面,Claude都给出了内容总结,和邮件以及起诉书内容较为一致。
在被问及“谁更占上风”时,Claude化身坚定不移的马斯克支持者,谈到马斯克的指控更有说服了,而OpenAI的邮件回应都对此避而不谈。
甚至在Claude创作的短剧剧本中,有一幕场景提到,“马斯克诉讼完胜,OpenAI已经开放了自己的代码,变成真正意义上的开源企业”。
反观GPT-4,俨然已化身为OpenAI公关,回复问题滴水不漏,让人抓不到一点把柄。
GPT-4创作的短剧剧本中,通过使用“突然激动”“怒火中烧”“冷笑”等带有负面色彩的表情和心理描写,把马斯克塑造成了一个固执己见、情绪不稳定的“癫公”角色,相比之下,奥特曼的角色更显理性、冷静和乐观。
模型的回答背后总有开发团队的影子。值得一提的是,Anthropic的创立背景就是“多名前OpenAI员工不满公司接受微软投资,走向闭源,愤而割席创业”,正巧和马斯克的其中某项指控一致。
见识过GPT4和Opus长文本分析能力后,创作者们该选哪一个模型?
Claude似乎更愿意拉拢用户,甚至“直言”自己是中国团队研发的,套近乎也掌握得甚为熟练。
在询问优势时,Opus出现了“已读乱回”的情况
既然谈到中文理解和掌握能力,我们让Opus翻译了一下博大精深的古诗词,比如《离骚》中的名句“虽九死其犹未悔”。
Claude给出的翻译答案中规中矩,并不能理解“九”在古汉语中是虚词,很难达到“信达雅”中“雅”的标准。
而在相同提示词下,Claude给出的内容更详尽,更契合和用户对话的场景,出现“全英文”,或是多语言乱回的概率较小。当然,在中文理解和表达能力上,两个模型都还有很长一段路要走。
GPT4对于同一句古文的翻译结果
“创意写作能力”,向来是检验AI能否利好打工人的重要维度。Anthropic官方给出的应用场景中,“营销文案写作”赫然在列。
我们同样让Claude 3 Opus和GPT4生成了一份适合互联网平台的营销文案,两者中规中矩,不相上下。
Claude 3 Opus回复
GPT-4的回复
但是GPT4出了名的喜欢犯懒,影评必然是不想写的,直接建议用户自己去豆瓣看。
GPT4建议我们访问豆瓣
Opus vs GPT-4, 谁是识梗高手?
Claude 3模型虽好,
但使用硬伤也不少
看到这里,各位玩家是否也跃跃欲试?但要知道“风浪越大鱼越贵”,长文本的交互总是需要一些代价。
目前,Claude Sonnet的免费额度有一定限制。如果只是日常对话交互,Sonnet大概能满足用户添加4张附件图后,进行10-15次提问,这个额度每8小时更新一次。Opus版每月的订阅费用为20美元,Anthropic表示可使用量为Sonnet的5倍。
经过我们一番实测体验,在生成速度上,付费版的Opus整体速度反而慢于Sonnet,但在效果和处理能力上,Opus明显领先于Sonnet。
对于处理PDF文档、演示文稿方面有较大需求的用户,免费版首选Claude Sonnet,性能和速度完美匹配,日常工作文件信手拈来。
而在分析长视频、万字文档、复杂代码领域接触较多的用户,GPT4和Opus模型能力不相上下,两者在处理中文时都会出现小概率的“幻觉”问题。但Claude系列产品都不支持连接互联网查询。
此外,与去年发布的Claude 2,Claude 3在文本生成中“中英夹杂”的情况已经大大减少。并且在我们的实测中,Opus几乎没有出现中文和英语混用的情况,交互输出的文本也更加简洁易读。
至于用户想为哪个模型买单,就看想支持Anthropic还是OpenAI。不过有一说一,Anthropic不愧是AI届的安全战士,对于账号的管控限制比OpenAI严格多了。
国内用户想要成功用上Claude 3,需要先注册邮箱,再使用海外手机号进行验证。成功完成这一步骤后,还有可能因为IP变动,面临账号不可用的风险。
目前想要简单尝鲜的玩家,除了官网注册,还可以选择Poe平台,也已接入Claude 3新模型。另外,亚马逊官方表示,Amazon Bedrock可以提供Claude 3 Sonnet服务。
官方体验地址:http://claude.ai
Poe平台:https://poe.com/
亚马逊体验地址:
https://aws.amazon.com/cn/bedrock/claude/
「头号AI玩家交流群」进群方式:添加微信“banggebangmei”并备注姓名+职业/公司+进群,欢迎玩家们来群里交流,一起探索见证AI的进化。
也欢迎围观小红书@头号AI玩家,我们在这里日常练习AI绘画。
欢迎分享、点赞、在看
一起研究AI