学术前沿 | 利用代数理论赋予人工智能解决IQ测试的归纳推理能力

原创 PKU-IAI 北京大学人工智能研究院

2024-09-16

导读

本文是人工智能研究院朱松纯、朱毅鑫教授及团队发表在ECCV 2022 论文Learning Algebraic Representation for Systematic Generalization in Abstract Reasoning 的介绍。

论文链接：

https://yzhu.io/publication/iq2022eccv/

归纳推理与机器智商

假设给出两个序列“a,b,c”和“d,e,f”并要求你依此填写“g,h,?”中问号所对应的字符，你基本上可以毫不费力地填上“i”，因为这样的序列构成了一种顺序结构，每个字符都是上一个字符在字母表中的后一项。这个问题看似简单，但其中所涉及的推理能力却不容忽视：你需要通过仅仅两个例子归纳出其中可能蕴含的隐藏关系，并应用这个关系，推断接下来的问题中所需要填写的内容。虽然推理过程看似复杂，但是这种能力其实在我们很小的时候就已经能够掌握。在心理学的研究中，已经有不少的假说尝试对这样的能力进行解释，包括“思想语言”（language of thought），“物理符号系统”（physical symbol system），和“代数思维”（algebraic mind）。

尽管这样的能力在人类成长早期就已经出现，但我们在研究中发现，现有的人工智能系统在类似的问题中仍然无法取得人类水平的表现。具体表现为虽然我们给予了大量的参考数据用于学习，但是现有方法所训练出来的人工智能系统模型，还是停留在计算统计量中的相关性，没有能够真正掌握归纳推理的精要：从现有的观察中抽象隐藏规律，并依照这样的规律去解决或预测接下来可能发生的事件。

到底怎样的人工智能才能解决类似的归纳推理问题？在这项研究中，我们提出一种代数学习的方法来尝试解决这类问题。在代数理论中，一条重要的公理就是皮亚诺公理。这条公理形式化地定义了代数系统和数字系统的根基，即如何构建一种公理化的体系去扩展我们的抽象符号系统。基于此，我们设计了一套能够进行关系归纳的系统，来解决智能测试中的核心问题：瑞文测试（Raven's Progressive Matrices），也就是人们常说的IQ测试 [1, 2, 3]。

图1（左）：认知能力环。瑞文测试位于这个认知能力环的中心

图2（右）：瑞文测试的一个例子

在心理测量中，瑞文测试一直被认为是认知能力测试中的核心。它囊括了各种认知推理的能力，包括数字推理 [4]，几何类比，以及最重要的归纳推理。在这种测试中，被试需要从提供的8张图片中寻找隐藏的关系，并利用这种关系去填补最后一张图片中的空缺。人类在这个任务上的表现与他的“通用智能”（general intelligence）和“流体智能”（fluid intelligence）密切相关，因此被普遍认为能够反映一个人的智商（IQ）。

近几年来，有一些深度学习的方法尝试提升人工智能系统在这个任务上的表现，但是我们发现，这类方法仅仅局限于学习题目表面上的统计相关性，无法深入发现题目中的规律，亦不能对这些规律进行拓展。

一种神经-"半"符号的方法

为了解决这个问题，我们提出了一种基于代数理论的神经半符号方法，ALANS。ALANS使用神经方法理解基本的图片，再使用符号方法去推断隐藏的关系。

具体地，ALANS使用神经网络的方案对每个题目中的图片先进行初步的解译：如理解每个物体所处的位置，他们的大小、形状、颜色是什么等。这些初步的解译结果并不是简单的堆叠；相反地，我们对每个物体保留一种概率的置信度。这样的概率置信度有助于我们对整个系统进行概率上的解读，也有助于我们保持系统的连续可倒特性。这些对于物体的初步理解被后续的置信分析过程整理成对一张图片的整体理解。

图3：使用神经方法进行单个物体的理解

图4：对一张图片中的所有物体进行置信分析

随后的符号过程使用代数理论去解答隐藏的关系。首先，符号系统利用皮亚诺公理将对单张图片的理解转化为高阶矩阵空间中的点。这些高维空间的点有助于我们将原本离散的代数运算符转化为矩阵空间中的变换。我们利用表示理论和代数系统的封闭性，将解析代数运算的问题转变为代数系统上的优化问题。选取最简单的线性优化问题来建模代数关系，不仅有解析解，且具有良好的可解释性。我们用每个题目中的题干部分分析隐藏关系，然后将分析所得的隐藏关系作用到题干中的缺失部分以预测可能的结果，再将预测的结果与选项做比较，获得最终的答案。由于我们的代数推理系统并不依赖于每个具体的运算符，而是可以在推理的过程中归纳新的运算符，因此我们称我们的方法是半符号的。

图5：使用代数理论归纳题干图片中的隐藏关系

图6：根据归纳出的关系，预测最后一个序列中的剩余项

在实验中我们发现，ALANS模型在RAVEN [1] 和I-RAVEN [5] 两个最常用的IQ测试数据集合中超过了现有的模型。它不仅泛化性能优异，而且在训练的过程中还能自动学习出不同的视觉表征和规则表征 [6]。

表7：ALANS在各项泛化指标上与现有模型进行对比

此外，ALANS不仅仅能做选择，还能做答案的生成，这点是与现有的模型的一个巨大区别 [7]。我们不仅能够给定选项找答案，在不给选项的情况下，我们也能生成一张答案的图片。下图就是这样的两个例子。我们利用ALANS方法，直接补全了题干中的缺失部分。这个补全方法除了在一些无关的随机变量上与选项中的正确答案不同，其他都与正确答案一模一样 [8, 9]。

图8：在两个例子中，ALANS直接生成最后的答案

总结与展望

在这项工作中，我们提出了ALANS模型。ALANS模型利用代数理论大幅度提升了现有智能系统的归纳推理能力。它不仅有一个视觉感知模块用于理解图片中的部分以及各部分组成的整体的特性，还具有一个能够进行代数推理的归纳系统。这套归纳系统利用皮亚诺公理和表示理论将离散的代数操作转化为连续的优化问题。通过解决这些容易的优化问题，我们不仅能够从小数据中归纳隐藏的关系，还能使得这些关系的归纳过程具有泛化性和扩展性。

未来，我们希望能够继续拓展这套归纳推理系统，引入更多、更加全面的代数结构，以帮助我们解决人工智能领域面对的各种挑战性难题。

References

[1] Zhang, Chi, et al. "Raven: A dataset for relational and analogical visual reasoning." Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition. 2019.

[2] Barrett, David, et al. "Measuring abstract reasoning in neural networks." International conference on machine learning. PMLR, 2018.

[3] Carpenter, Patricia A., Marcel A. Just, and Peter Shell. "What one intelligence test measures: a theoretical account of the processing in the Raven Progressive Matrices Test." Psychological review 97.3 (1990): 404.

[4] Zhang, Wenhe, et al. "Machine number sense: A dataset of visual arithmetic problems for abstract and relational reasoning." Proceedings of the AAAI Conference on Artificial Intelligence. Vol. 34. No. 02. 2020.

[5] Hu, Sheng, et al. "Stratified rule-aware network for abstract visual reasoning." Proceedings of the AAAI Conference on Artificial Intelligence. Vol. 35. No. 2. 2021.

[6] Zhang, Chi, et al. "Abstract spatial-temporal reasoning via probabilistic abduction and execution." Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition. 2021.

[7] Zhang, Chi, et al. "Learning perceptual inference by contrasting." Advances in neural information processing systems 32 (2019).

[8] Zhang, Chi, et al. "Acre: Abstract causal reasoning beyond covariation." Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition. 2021.

[9] Zhu, Yixin, et al. "Dark, beyond deep: A paradigm shift to cognitive ai with humanlike common sense." Engineering 6.3 (2020): 310-345.

— 往期发布 —

学术前沿 | 锤子应该这么挥，物理常识驱动机器人工具使用

点击图片查看原文

学术前沿 | 赋予机器人利用环境的能力，基于场景图的任务规划

点击图片查看原文

学术前沿|北京大学唐希源助理教授及合作者在IEEE TCAS-I 发表低功耗SAR ADC设计综述的亮点论文

点击图片查看原文

朱松纯、朱毅鑫团队研究成果登上Science头条：AI赋能机器人、“读懂”人类价值观

点击图片查看原文

本微信公众号所有内容，由北京大学人工智能研究院微信自身创作、收集的文字、图片和音视频资料，版权属北京大学人工智能研究院微信所有；从公开渠道收集、整理及授权转载的文字、图片和音视频资料，版权属原作者。本公众号内容原作者如不愿在本号刊登内容，请及时通知本号，予以删除。

继续滑动看下一个

北京大学人工智能研究院

向上滑动看下一个

法明传[2024]173号：1月1日起，未用示范文本提交起诉状，部分法院将不予立案

法明传[2024]173号：1月1日起，未用示范文本提交起诉状，部分法院将不予立案

法明传[2024]173号：关于加快推进起诉状、答辩状示范文本全面应用工作的通知(附下载链接)

2025.1.1起，全国法院全面推进应用民事起诉状、答辩状示范文本(附下载链接)

2025.1.1起，全国法院全面推进应用民事起诉状、答辩状示范文本(附下载链接)

学术前沿 | 利用代数理论赋予人工智能解决IQ测试的归纳推理能力

您可能也对以下帖子感兴趣

法明传[2024]173号：1月1日起，未用示范文本提交起诉状，部分法院将不予立案

法明传[2024]173号：1月1日起，未用示范文本提交起诉状，部分法院将不予立案

法明传[2024]173号：关于加快推进起诉状、答辩状示范文本全面应用工作的通知(附下载链接)

2025.1.1起，全国法院全面推进应用民事起诉状、答辩状示范文本(附下载链接)

2025.1.1起，全国法院全面推进应用民事起诉状、答辩状示范文本(附下载链接)

生成图片，分享到微信朋友圈

学术前沿 | 利用代数理论赋予人工智能解决IQ测试的归纳推理能力

您可能也对以下帖子感兴趣