Chat-GPT 可以做数学吗？

返朴 2023-01-27

The following article is from 遇见数学 Author George Shakan

点击上方蓝字“返朴”进入主页，可关注查阅往期文章

撰文 | George Shakan

翻译 | 蒋迅

译者注：本文试图说明Chat-GPT在数学证明领域里还有缺陷。所以下面除了最基本的问题外，Chat-GPT给出的证明都是不正确的。请读者不要把这里的证明当作标准答案。

Chat-GPT是Open AI发布的令人印象深刻的全新AI聊天机器人。它令人印象深刻的应用程序可以在整个互联网上找到。但它能做数学吗？

通过数学，我们并不意味着简单地做一些计算。它自己的设计确保了存在着它无法解决的计算问题。我更感兴趣的是它可否解决需要一些数学推理的问题。

为了选择我们的问题，我们使用了MMLU数据集。Meta AI最近发布的大型语言模型Galactica在这个数据集上取得了一些不错的结果。他们的发现陈述在他们论文的第5.3节中。

接下来，我们将挑选几个问题，看看Chat-GPT如何处理它们。如果失败，我们将尝试改写这个问题以期获得部分结果。

我们注意到MMLU数据集有多项选择题，但我们只是将问题呈现给Chat-GPT。我们只是从MMLU的抽象代数部分选择问题。之后，我们将刺激Chat-GPT以获得直觉和证明。在最后，我们将向数学家推荐Chat-GPT的一些应用。

问题一

我：乘法群中的逆是

Chat-GPT: 乘法群中的逆是。群中元素的逆元素是满足的元素，其中是该群的单位元。在这个群中，是单位元，所以元素的逆元素是满足的元素。

例如，的逆是，因为。同样，的逆是，因为。

注： Chat-GPT完美地回答了这个问题并给出了极好的解释。公平地说，这是一个较简单的问题。

问题二

我：到有多少个同态？请以latex格式书写。

Chat-GPT: 有两个到的同态。它们的定义如下：

满足对于所有，成立

满足对于所有的, 成立

注：同样，Chat-GPT是正确的。但是，这个问题我问了几次，有一次说了，有一次说了却给出了错误的理由：

（整数）到（整数模 2）只有两个同态。

一个同态将每个整数映射到，另一个同态将每个整数映射到。

问题三

我：令中的p = (1, 2, 5, 4)(2, 3)。在中找到的指数。请用latex写下你的答案。

Chat-GPT:

在中的指数是中按字典顺序出现在之前的元素数。

要找到的指数，首先要确定p的循环类型。排列的循环类型是其不相交循环的长度列表，按降序排列。

p的循环型是[2,2]，因为p由一个2-循环和一个2-循环组成。

现在我们可以使用的循环指数来确定循环类型为[2,2]的S_5中的排列数。

的循环指数由下式给出：

其中是中循环的排列数，是表示长度为的循环的变量。

将循环类型[2,2]代入循环指数给出：

它简化为：

该表达式中的系数为，所以循环型为[2,2]的中的排列数为。

由于是中唯一具有循环型[2,2]的排列，因此它是中的第排列。

因此，在中的指数为。

注：哇！这是非常错误的！第一句话是完全错误的。还有，它最后的结论，连整数都不是，这肯定是不对的。事实上，子群的指数是有一定意义的，而且大多数是正整数。

不过，我们能够挽救一些东西。假设我们使用代数技巧计算出的阶数为。然后我们可以使用以下提示Chat-GPT。

我：现在假设是 5 阶子群。在中的指数是多少？

Chat-GPT: 群中子群的指数是在中的左陪集数。这也等于在中的右陪集数。

由于子群的阶数能整除群的阶数，因此的阶数必须除以的阶数，即120。120 的小于 120 的因数只有 1, 2, 3, 4, 5, 6, 8, 10, 12, 15, 20, 24, 30, 40, 和 120。因此，的唯一可能顺序是 1, 2, 3, 4, 5, 6, 8, 10, 12, 15, 20 、24、30、40 和 120。

由于的阶数为 5，所以在中的指数为。

注：在这里，Chat-GPT正确回答并给出了一个完美的解释。也许最好提一下所使用的主要事实是拉格朗日定理，尽管这可以很容易地通过问它“上面你使用了什么定理？”来获得。

但是直觉是什么？

使研究数学家伟大的是对问题的某种“直觉”。让我们看看Chat-GPT是否可以解释其中的任何一个。

我：你能解释一下柯西-施瓦茨不等式背后的直觉吗？请用latex写所述的数学公式。

Chat-GPT: 当然！柯西-施瓦茨不等式是一个有用的不等式，出现在数学的各个领域，例如向量代数、内积空间和概率论。它指出对于任意两个向量和，以下不等式成立：

直觉上，柯西-施瓦茨不等式指出两个向量和的内积由向量和的长度“控制”。要了解这一点，让我们考虑和是单位向量（即长度为 1 的向量）的特殊情况。在这种情况下，不等式变为：

这意味着和的内积总是小于或等于 1。这与我们的直觉一致，即如果两个单位向量“正交”（即垂直），则它们的内积应该“小”，并且如果它们“平行”（即指向同一方向），则为“大”。

我希望这有所帮助！如果你有任何问题，请告诉我。

注：这还算不错，但肯定可以改进。例如，解释什么时候柯西-施瓦茨不等式何时成立（当一个向量是另一向量的倍数时）有助于给出最后一段更精确的含义。人们可以看到陶哲轩这篇博客文章的前几段，以了解来自世界领先数学家之一的解释。此外，这是Stackexchange上关于该主题的数学讨论。

给出证明

我：你能证明这个吗？

Chat-GPT: 当然！这是柯西-施瓦茨不等式的证明：

首先，我们可以将不等式重写为：

接下来，我们可以如下展开左侧：

此式简化为：

现在，我们可以将算术-几何平均不等式应用于右侧的每一项：

这简化为：

最后，我们可以再次将算术几何平均不等式应用于右侧的项：

这简化为：

我们完成了！这就完成了柯西-施瓦茨不等式的证明。

我希望这个能有所帮助！如果你有任何问题，请告诉我。

注：不幸的是，这个证明并不完全正确。无论是证明方法还是细节（即它对 AM-GM 的应用）都存在严重缺陷。

结论

老实说，Chat-GPT对于一个无论如何都不是为数学量身定做的模型来说是相当令人印象深刻的。我认为，以目前的格式，它已经可以帮助数学家准备讲义甚至论文中更简单的部分。也许它最大的用处在于自动处理基金和工作申请的某些部分。

本文经授权转载自微信公众号“遇见数学”。

原文链接：https://gshakan.wordpress.com/2023/01/02/can-chat-gpt-do-math/

”FAN某”的离婚财产分割判决书（全文）

”FAN某”的离婚财产分割判决书（全文）

公益慈善｜“翼行天下一生守护”慈善项目捐赠仪式圆满举行！

何炅突然高调官宣喜讯，网友恭喜：30年了，终于等到这一天！

女性最佳“绝经期”已公布，不是45岁，而是这个数，越接近越健康！

Chat-GPT 可以做数学吗？

您可能也对以下帖子感兴趣

”FAN某”的离婚财产分割判决书（全文）

”FAN某”的离婚财产分割判决书（全文）

公益慈善｜“翼行天下 一生守护”慈善项目捐赠仪式圆满举行！

何炅突然高调官宣喜讯，网友恭喜：30年了，终于等到这一天！

女性最佳“绝经期”已公布，不是45岁，而是这个数，越接近越健康！

生成图片，分享到微信朋友圈

Chat-GPT 可以做数学吗？

您可能也对以下帖子感兴趣

公益慈善｜“翼行天下一生守护”慈善项目捐赠仪式圆满举行！