16美元/月的Grok，值得入手吗 | 分享实际上手体验

Original 思辨view kate人不错 2024-05-19

Grok AI (测试版）现已向美国所有XPremium+ 订阅者推出。

我是下午付费升级到XPremium+ ，付费成功后就可以在x的手机客户端和web看到Grok了。现在可以用中文输入问题，但是英文输入会得到更好的输出内容。

网页上16美元/月

iOS端22美元/月

安卓端显示暂不可升级

升级小插曲，第一次付款没成功，账单地址栏灰色无法填写，大概半小时后，第一次订单被取消，后续再支付，就可以了。

我看到一位Grok早期用户，他的界面如下：

这个网页对应的网址是：grok.x.ai，但是我输入该网址，提示以下内容。

Grok可选正常模式或趣味模式

下图是趣味模式下的回答，充满着马斯克的自信。

译文：

Grok是由xAI开发的一款AI工具，旨在为用户提供独特的AI体验。
得益于其大型语言模型和对X平台的实时访问，Grok能理解并回应各种问题和主题。
Grok具有幽默甚至有时反叛的个性，使得与它的互动更具吸引力和娱乐性。
Grok可以帮助完成各种任务，如回答问题，提供信息，提出建议，甚至生成代码。
Grok仍处于开发的早期阶段，正在不断提高其能力。
目前，Grok只向美国的一部分用户开放，但计划在未来扩大其可用性。
可以通过X平台访问Grok，它将专为X Premium+订阅者提供。
Grok是一种多功能工具，可用于各种目的，如内容创作，学习和娱乐。
Grok还可以帮助用户获取实时信息和洞见，因为它可以访问X平台。
总的来说，Grok是一款强大且创新的AI工具，有可能改变我们与技术互动和获取信息的方式。

Grok的一大特色是接入x的数据，在回答的最下面会展示相关的推文（但是有时推荐的推文和上文毫无关系）。

点击关联的推文，右侧会显示详情。

最大输入字符是4k。

Grok不能读取URL对应的内容。

Grok访问x的数据无限制。

Grok接入的x的数据不是实时的，比如我问它Elon Musk的最新1条推文，经比对，它返回给我的不是最新数据。

Grok的中文生成能力太差。

当我转为Bard（使用Gemini Pro模型）咨询这个问题时，Bard说它不能接入到x的数据，但是它给出了方法和假设。

将Bard给到的方法作为提示词，Grok有了更好的表现。

Grok的幽默还体现在下图：

同样的问题，Claude还是很直男。

在代码生成方面，我发现Grok的性能不如GPT-4。

GPT4画的兔子比grok画的兔子更像，而且提供了完整的代码。（截图是部分内容）

Grok和GPT哪个更好，请它们自己回答：

下图用到的是perplexity.ai（可以联网检索），模型用的是GPT4。

可以看出，perplexity生成的结果更好。

分别问Grok和perplexity，LCM和SDXL Turbo的区别，perplexity（GPT-4）回答更好。

perplexity也可以检索x的信息，但是对应的链接一般是链接到对应的博主首页，而非最相关的推文。

现在回答标题里提出的问题：

16美元/月的Grok，值得入手吗？

针对现在的版本，我觉得不值得入手。

理由：

输入字符数较少（只有4k）。
写文章能力一般，文章层级混乱。
对比GPT4，Grok现只支持文本输入，其实时检索功能生成的内容，也不如perplexity（GPT4模型下）。

Grok的发展历史很短，但它已经显示出强大的潜力，Grok的幽默和有时候反叛的个性，使得与它的互动更具吸引力和娱乐性。

然而，Grok并不是完美的。例如，它的中文处理能力有待提高，它不能实时读取URL对应的内容，它接入的X平台的数据也不是实时的。

马斯克也说了Grok几乎每天都会有快速改善，我相信随着技术的进步和xAI公司的不断努力，Grok将会成为一个强大的工具，帮助我们更好地理解世界，更有效地获取信息，更有趣地与技术互动。

有竞争就会有进步。

延伸阅读：

Grok的诞生背景

“Grok”这个名字源自科幻小说《银河系漫游指南》，意味着深刻理解和共鸣。xAI公司的愿景是创建一种能够帮助全人类在理解和知识追求上的工具。Grok的设计不仅仅是为了回答问题，更能够以一种带有智慧和幽默的方式，甚至提出问题。这种设计哲学标志着一个巨大的飞跃，因为它意味着AI不再是单一的信息处理工具，而是能够更深入地与人类的思维模式接轨。

Grok的技术优势

Grok的核心是Grok-1，一个开创性的LLM（大型语言模型），它在短短四个月内完成了多次迭代。从原型Grok-0到现在的Grok-1，性能有了显著的提升，在HumanEval编码任务中达到63.2％的成绩，在MMLU多学科选择题中达到73％。这些成绩表明，即使与数据和计算资源更丰富的模型如GPT-4相比，Grok-1在其计算级别的模型中也显示出了强大的竞争力。

Grok与现存AI的比较

在Grok-1的基准测试中，它在GSM8k中学校数学问题解决中得到62.9％的成绩，而在同类测试中，其他模型如GPT-3.5和Claude 2的表现都未能达到这一水平。这一结果不仅证实了Grok在处理复杂问题上的出色能力，还展示了xAI在训练高效LLMs方面取得的快速进步。

Grok的实际应用前景

除了在标准测试中的好成绩，Grok在2023年匈牙利国家高中数学考试中也得到了C（59％）的评级。这一“真实世界”的测试进一步验证了Grok在处理未经特别调整的数据集时的能力。这意味着Grok在日常应用中的潜力巨大，它可以帮助研究人员、学生和业余爱好者等广泛用户群体。

xAI公司的研究与工程

在深度学习研究的前沿，xAI公司构建了一套基于Kubernetes、Rust和JAX的定制培训和推理堆栈。这套系统能够处理数以万计的GPU在数月时间内的同步计算，即使面对硬件不稳定的情况也能保持高效运行。

以下是一些我之前的文章，你可能会对它们感兴趣：

效果炸裂 | Google 刚发布 Gemini，开启多模态智能的新时代

用AI生成PPT、用AI优化PPT

tldraw make real：利用AI一键从原型图到生成真实可用的代码

深度使用GPTs的分享——授人以鱼不如授人以渔

继续滑动看下一个

kate人不错

向上滑动看下一个

故意按摩让女生“产生欲望”后发生关系，算性侵吗？

天佑开麦再赞阿哲！阿厦爆瓜老爸三亚看阿哲！阿哲开干多元赛！

老塔申请强制执行，小白龙被限高！主播要账晨一，遭警告冻结！

夺人气票！爆阿哲拉菲聊天记录！旭旭宝宝被封，@阿哲！怒斥官方权限双标！

哲家没面子！俊雅呆呆爆骂某主播，主播现场致歉阿哲！美人哥豪刷俊雅！

16美元/月的Grok，值得入手吗 | 分享实际上手体验

您可能也对以下帖子感兴趣

故意按摩让女生“产生欲望”后发生关系，算性侵吗？

天佑开麦再赞阿哲！阿厦爆瓜老爸三亚看阿哲！阿哲开干多元赛！

老塔申请强制执行，小白龙被限高！主播要账晨一，遭警告冻结！

夺人气票！爆阿哲拉菲聊天记录！旭旭宝宝被封，@阿哲！怒斥官方权限双标！

哲家没面子！俊雅呆呆爆骂某主播，主播现场致歉阿哲！美人哥豪刷俊雅！

生成图片，分享到微信朋友圈

16美元/月的Grok，值得入手吗 | 分享实际上手体验

您可能也对以下帖子感兴趣