Gemini Ultra 除夕发布了，不等于说谷歌可以过年了 | 笔记

Original 周健工未尽研究

2024-08-23

终于，谷歌与AI相关的无数产品，拥有了一个共同的名字：Gemini。它可能结束了谷歌许多部门都在搞AI，整个公司却不知如何与微软/OpenAI竞争的局面。谷歌赶着中国龙年的除夕，发布了号称唯一胜过人类专家水平的大模型Gemini Ultra1。谷歌去年底曾发布了较低版本的Gemini Pro和用于终端设备的Nano1、Nano2。“最大的模型Ultra 1.0是第一个在MMLU（大规模多任务语言理解）方面超越人类专家的模型，MMLU结合了57个科目——包括数学、物理、历史、法律、医学和伦理学——来测试知识和解决问题的能力。” 但究竟有多大，谁也不知道。谷歌用来与ChatGPT竞争的Bard，也已经改名Gemini。一打开页面，它向我问好：

我先试了下它从英文翻译成中文的功能。它能提供三个翻译版本供选择。同时它披露，我的这个对话背后，有人在审核：“为了更好地改进，经过培训的审核人员需要处理您的对话。因此，在使用双子座时，请不要输入您不想让审核人员查看或谷歌用来改进服务的任何内容。请注意，您的谷歌工作区内容，例如来自 Gmail 或 Drive 的内容，不会被用于改进双子座。”然后我让它为我以“龙马精神，恭喜发财”为意，设计一幅恭贺新年的贺卡。它回答说还没有文生图功能。于是我给它出了一道题，在英语里人们称之为Apple测试，即让它造出十个以Apple结尾的句子。我要求它给我造出十个以“龙”为结尾的句子，姑且命名为龙测试。来了：

审核得不错。我又让ChatGPT造出十个以“龙”字结尾的句子，如下：

接下来，我想试试它的文生图功能。我要求它设计一张图，以“龙马精神，恭喜发财”为意，贺中国新年。Gemini的回答是：

我以同样的意思，让GPT-4设计了一幅。能看懂上面的字吗？意思看懂了，就是不认得。

我让Gemini写一段代码，帮助我收集一些好的素材，用来设计一幅龙年新年的贺卡。几行Python代码立刻出现，提供了三个方案。

我选择了其中的一个，这段代码使用 Unsplash API 来搜索素材。Unsplash 是一个提供高质量免费图片的网站。最后，它会交付给我一个相关图片的链接列表。还能帮我找到10张龙的图片。Gemini的发布，对于谷歌更重要的意义是，以往不同产品与服务的AI功能，都统称为Gemini。如Duet AI 将成为 Gemini for Workspace，很快拥有 Google One AI Premium 计划的消费者就可以在 Gmail、文档、表格、幻灯片和 Meet 中使用 Gemini。对于云客户来说，Duet AI 也将在未来几周内成为 Gemini。以往谷歌也做了一大堆大模型，今后谷歌的业务，都统一建立在Gemini的基础之上了。Gemini (基于Pro模型）仍然免费，相当于ChatGPT(基于GPT-3.5)；其高级版本Gemini Advanced （基于Ultra1模型），将每月收费19.9美元，与ChatGPT-Plus （基于GPT-4模型）相同。看来，使用高端人工智能的起始价格，就是每月20刀了。Gamini应用还推向安卓和iOS设备。关于Gemini不明觉厉的地方，可以在谷歌的技术报告中找到一些答案。在这里你可以看到一大堆的测试报告，包括这次老老实实地标注出在最重要的MMLU综合测试中，Gemini Ultra的5样本测式并没有胜过GPT-4。

Gemini完整推出，也完成了过去一年谷歌在AI战略上的抓狂。现在Gemini将会变得和Google一样重要，更重要的是，它们都可以用字母G作为开头。谷歌所面对的挑战，是要同时与OpenAI和微软竞争。它需要研发出一个最起码匹敌GPT-4的大模型，同时，在应用其业务中，尤其是在生产力工具方面，要与微软竞争。但谷歌的优势在于，它拥有强大的消费群体，应用场景更丰富，创新新产品的空间更大。都说大模型是大力出奇迹的结果，那么，谷歌既不缺算力，更不缺钱，为什么不出一个碾压GPT-4的大模型？这里面有几种可能：首先，大模型的缩放法则，即更强的算力-更大的模型-更多的智能涌现，可能正在接近上限，而GPT-4 级别的模型，已经接近了大型语言技术所能达到的 AI 能力上限，这是否意味着 AI 能力的指数增长会暂告一段落。其次，是谷歌的一个商业策略。它的确需要一个可以与 GPT-4 竞争的模型，因此训练了 Gemini 达到该水平，然后停止了研发。它要看下GPT-5会不会有重大突破，然后再考虑Ultra2。最后，可能OpenAI 真的拥有其他公司无法复制的某种“独门秘籍”，只有OpenAI自己能超越自己，谷歌虽然尽了最大努力，却无法破解 OpenAI 的秘密。过去的一年多来，GPT-4统治着大模型世界，今天终于有一家能与其竞争，这也许是一个新时代的开始。它也告诉人们，只有做到了GPT-4和Gemini的水平，才能进入真正的应用领域。这样看来，开源的模型面临更大的压力，拥有最大算力集群的Meta，今年不知何时能推出一个什么样的Llama3。除夕谷歌发Gemini Ultra1，OpenAI的GPT-5还过得了十五吗？

继续滑动看下一个

未尽研究

向上滑动看下一个

二湘：朱令去世一周年，清华学子控诉清华在朱令案中的冷血和无耻

“四川大学姜涛与爱人程月玲”，你们现在还好吗？

为了这部描述从“反右”到“文革”的禁片，田壮壮付出了十年不能拍片的代价

关于字节基建

李宜雪的良知卖了2万元，真正需要声援的是罗灿宏啊

Gemini Ultra 除夕发布了，不等于说谷歌可以过年了 | 笔记

您可能也对以下帖子感兴趣

二湘：朱令去世一周年，清华学子控诉清华在朱令案中的冷血和无耻

“四川大学姜涛与爱人程月玲”，你们现在还好吗？

为了这部描述从“反右”到“文革”的禁片，田壮壮付出了十年不能拍片的代价

关于字节基建

李宜雪的良知卖了2万元，真正需要声援的是罗灿宏啊

生成图片，分享到微信朋友圈

Gemini Ultra 除夕发布了，不等于说谷歌可以过年了 | 笔记

您可能也对以下帖子感兴趣