查看原文
其他

16美元/月的Grok,值得入手吗 | 分享实际上手体验

思辨view kate人不错 2024-05-19

Grok AI (测试版) 现已向美国所有XPremium+ 订阅者推出。

我是下午付费升级到XPremium+ ,付费成功后就可以在x的手机客户端和web看到Grok了。现在可以用中文输入问题,但是英文输入会得到更好的输出内容。

网页上16美元/月

iOS端22美元/月

安卓端显示暂不可升级

升级小插曲,第一次付款没成功,账单地址栏灰色无法填写,大概半小时后,第一次订单被取消,后续再支付,就可以了。

我看到一位Grok早期用户,他的界面如下:

这个网页对应的网址是:grok.x.ai,但是我输入该网址,提示以下内容。

Grok可选正常模式或趣味模式

下图是趣味模式下的回答,充满着马斯克的自信。

译文:

  1. Grok是由xAI开发的一款AI工具,旨在为用户提供独特的AI体验。
  2. 得益于其大型语言模型和对X平台的实时访问,Grok能理解并回应各种问题和主题。
  3. Grok具有幽默甚至有时反叛的个性,使得与它的互动更具吸引力和娱乐性。
  4. Grok可以帮助完成各种任务,如回答问题,提供信息,提出建议,甚至生成代码。
  5. Grok仍处于开发的早期阶段,正在不断提高其能力。
  6. 目前,Grok只向美国的一部分用户开放,但计划在未来扩大其可用性。
  7. 可以通过X平台访问Grok,它将专为X Premium+订阅者提供。
  8. Grok是一种多功能工具,可用于各种目的,如内容创作,学习和娱乐。
  9. Grok还可以帮助用户获取实时信息和洞见,因为它可以访问X平台。
  10. 总的来说,Grok是一款强大且创新的AI工具,有可能改变我们与技术互动和获取信息的方式。

Grok的一大特色是接入x的数据,在回答的最下面会展示相关的推文(但是有时推荐的推文和上文毫无关系)。

点击关联的推文,右侧会显示详情。

最大输入字符是4k。

Grok不能读取URL对应的内容。

Grok访问x的数据无限制。

Grok接入的x的数据不是实时的,比如我问它Elon Musk的最新1条推文,经比对,它返回给我的不是最新数据。

Grok的中文生成能力太差。

当我转为Bard(使用Gemini Pro模型)咨询这个问题时,Bard说它不能接入到x的数据,但是它给出了方法和假设。

将Bard给到的方法作为提示词,Grok有了更好的表现。

Grok的幽默还体现在下图:

同样的问题,Claude还是很直男。

在代码生成方面,我发现Grok的性能不如GPT-4。

GPT4画的兔子比grok画的兔子更像,而且提供了完整的代码。(截图是部分内容)

Grok和GPT哪个更好,请它们自己回答:

下图用到的是perplexity.ai(可以联网检索),模型用的是GPT4。

可以看出,perplexity生成的结果更好。

分别问Grok和perplexity,LCM和SDXL Turbo的区别,perplexity(GPT-4)回答更好。

perplexity也可以检索x的信息,但是对应的链接一般是链接到对应的博主首页,而非最相关的推文。

现在回答标题里提出的问题:

16美元/月的Grok,值得入手吗?

针对现在的版本,我觉得不值得入手。

理由:

  1. 输入字符数较少(只有4k)。

  2. 写文章能力一般,文章层级混乱。

  3. 对比GPT4,Grok现只支持文本输入,其实时检索功能生成的内容,也不如perplexity(GPT4模型下)。

Grok的发展历史很短,但它已经显示出强大的潜力,Grok的幽默和有时候反叛的个性,使得与它的互动更具吸引力和娱乐性。

然而,Grok并不是完美的。例如,它的中文处理能力有待提高,它不能实时读取URL对应的内容,它接入的X平台的数据也不是实时的。

马斯克也说了Grok几乎每天都会有快速改善,我相信随着技术的进步和xAI公司的不断努力,Grok将会成为一个强大的工具,帮助我们更好地理解世界,更有效地获取信息,更有趣地与技术互动。

有竞争就会有进步。

延伸阅读:

Grok的诞生背景
“Grok”这个名字源自科幻小说《银河系漫游指南》,意味着深刻理解和共鸣。xAI公司的愿景是创建一种能够帮助全人类在理解和知识追求上的工具。Grok的设计不仅仅是为了回答问题,更能够以一种带有智慧和幽默的方式,甚至提出问题。这种设计哲学标志着一个巨大的飞跃,因为它意味着AI不再是单一的信息处理工具,而是能够更深入地与人类的思维模式接轨。
Grok的技术优势
Grok的核心是Grok-1,一个开创性的LLM(大型语言模型),它在短短四个月内完成了多次迭代。从原型Grok-0到现在的Grok-1,性能有了显著的提升,在HumanEval编码任务中达到63.2%的成绩,在MMLU多学科选择题中达到73%。这些成绩表明,即使与数据和计算资源更丰富的模型如GPT-4相比,Grok-1在其计算级别的模型中也显示出了强大的竞争力。
Grok与现存AI的比较
在Grok-1的基准测试中,它在GSM8k中学校数学问题解决中得到62.9%的成绩,而在同类测试中,其他模型如GPT-3.5和Claude 2的表现都未能达到这一水平。这一结果不仅证实了Grok在处理复杂问题上的出色能力,还展示了xAI在训练高效LLMs方面取得的快速进步。
Grok的实际应用前景
除了在标准测试中的好成绩,Grok在2023年匈牙利国家高中数学考试中也得到了C(59%)的评级。这一“真实世界”的测试进一步验证了Grok在处理未经特别调整的数据集时的能力。这意味着Grok在日常应用中的潜力巨大,它可以帮助研究人员、学生和业余爱好者等广泛用户群体。
xAI公司的研究与工程
在深度学习研究的前沿,xAI公司构建了一套基于Kubernetes、Rust和JAX的定制培训和推理堆栈。这套系统能够处理数以万计的GPU在数月时间内的同步计算,即使面对硬件不稳定的情况也能保持高效运行。

以下是一些我之前的文章,你可能会对它们感兴趣:

效果炸裂 |  Google 刚发布 Gemini,开启多模态智能的新时代

用AI生成PPT、用AI优化PPT

tldraw make real:利用AI一键从原型图到生成真实可用的代码

深度使用GPTs的分享——授人以鱼不如授人以渔

继续滑动看下一个
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存