查看原文
其他

研读 | WAIC2022回顾 (2):通用智能与认知智能改变世界

The following article is from Mindverse Research Author 心识宇宙团队


人工智能对元宇宙的建设可以在基础设施、交互与生态三个层次上多维度结合。在上一期对今年世界人工智能大会(WAIC)的回顾中,我们已经总结了 AI 对元宇宙 3D 场景和内容建设的分享和研究。在本次回顾中,我们将分享与通用智能和认知智能相关的内容,以探索关于元宇宙场景的信息入口与生产要素。



目 录

  1. 智能本质与第一性原理

  2. 认知智能科学:基于脑与认知科学的人工智能

  3. 意识图灵机:一种可解释的人工智能


智能本质与第一性原理


美国加州大学伯克利分校电子工程的马毅做了分享《智能本质与第一性原理》,是对前不久发表的论文《On the Principles of Parsimony and Self-Consistency for the Emergence of Intelligence》的解读。马毅试图解决关于智能的两个基本问题:学习什么以及如何学习。马毅认为智能学习要满足简洁性(Parsimony)和自洽性(Self-consistency)两个基本原则,这是人工或自然智能涌现的基石。


在第一个问题上,将智能理解为从高维真实数据学习的过程,并满足简洁性原则。即在高维空间  中对多个低维流形   上的样本数据   ,通过学习一个压缩闭环转录的非线性映射   ,获得一个最紧凑结构化的可线性判别表征  。这个过程可以通过深度神经网络计算交叉熵损失函数建模获得。
简洁性原则的基本解释如下。其中    和    是连续且满足约束等距性的函数,并且存在自编码过程即    。考虑维度,对流形    或   ,通常真实维度   ,也就是说在学得表征    的结构通常隐藏在  中。
显然  对生物体来说,是一个传感器编码的过程,生物有有效生存,同时必须要求它能从 LDR 还原原始数据,即存在解码过程   。因此这就引出了第二个问题:智能如何学习。在这点马毅认为智能学习要满足自洽性(Self-consistency)原则。

自洽性原则的基本解释如下。简言之,与简洁性一致,要求在转录真实数据所在流形   到 LDR 的过程中,表征    所在的子流形    要满足线性、可判别(Discriminative),且对  在  、   能实现自嵌入(Auto-embedding),这样生物体对环境就能形成控制闭环并进行博弈。

两个原则的总体框架如下。可以看到它不仅适合视觉,对触觉、听觉以及多感官模态过程同样适用。

在这样的框架下,智能将作为一个整体的整合系统,而不是大脑功能分化、对各种任务特化的诸多模块。

马毅的观点和微分学家顾险峰深度学习的几何化观点不谋而合,但要将类似框架推进,还有很多领域具体问题需要解决。




认知智能科学:基于脑与认知科学的人工智能


清华大学基础科学讲席教授刘嘉题为《Cognitive NeuroIntelligence  AI of Brain Cognition》的分享。在他看来,智能可以根据开放—封闭,静态—动态两个维度分为四种,分别是


  • 强化学习:计划 & 决策
  • 计算视觉:检测 & 分类
  • 制论:漫游 & 觅食
  • 强人工智能(AGI):开放任务&环境

但对生物智能而言,尺度不是问题。从线虫到人脑,都能具备以上四种智能。只不过随着规模和复杂度增加,智能所面对的任务复杂度也有所增加。但不管哪个尺度,生物智能都能在极少成本下解决传统AI消耗巨大的问题。因此人工智能下一步发展是生物或脑启发AI(Brain-inspired Al)

生物神经元受到时间、空间和材料等经济成本制约,并且受体积、新陈代谢、信号延迟和衰减以及发育过程等限制。因此首先可以从生物智能学习的是其具有:1. Wiring Cost Minimization(布线成本最小化)。这可以被理解为一个赢者通吃的自组织优化过程。

接着是 2. Cortical Point Spread(皮层细胞质点扩散过程)。即由外部刺激引发的神经活动向侧面扩散,从最初点火的神经元到周围的神经元,通过其轴突投射到附近的神经元。

在网格中赢家单元    的邻域用以下公式更新,其中    是邻域函数,由高斯形式给出。

最后是 3. Modularity(形成模块化),模块一种专门用于解决特定信息处理问题的神经基质。例如结构约束下的赫布学习规则(Hebbian rule)

刘嘉认为在这三种启发下,可以建立基于自组织映射的人工皮质界面。

但正如W.Duran所言「我们所知道的世界是我们所构建的。在这个构建的世界里,我们的心灵提供了构建的模具,而外部世界则提供了原料」,又如David Marr所言「了解鸟类飞行,需要空气动力学,而非羽毛的结构和翅膀的形状」,因此研究智能又不能完全模仿人类智能,而是需要知道是有关世界和智能的基本原则。所有我们同样知道有关我们世界、尤其和我们心智交互的基本原则。这就引出了我们必须关于具身(Embodied)于世界模型(world model)的心智

尤其是有关基于直觉物理引擎的世界模型(Intuitive Physics Engine: World Model),这就是人类智能具备而传统 AI 不具备的。例如可以假设,生物对重力的感知,就是从环境互动中学来的。通过研究计算发现,在心智中感知的重力,和在现实世界牛顿物理学种类非常接近。

对这个方向认知的研究就是认知科学中的具身认知(Embodied Cognition),这对应于有关智能的是在广阔范围的环境中达成目标的能力的定义。刘嘉认为这是未来 AGI 研究的的重要方向。

而要实现这点,需要认知科学、计算科学以及脑科学实验观测三者结合。




意识图灵机:一种可解释的人工智能


美国卡内基梅隆大学计算机科学学院Manuel BlumLenore Blum做了有关意识图灵机的报告。


意识图灵机(CTM),是一种能够表达感受而非仅仅模拟的机器,由 <STM, LTM, Up-Tree, Down-Tree, Links, Input, Output> 七元组系统组成,以及每个记忆组块具有 <address, time, gist, weight, intensity, mood> 六种属性,具有确定性和概率性。它是对神经科学家 Bernard Baars 剧场模型和全局空间理论的新理解和数学模型化,但与之在短时记忆中可以具有多重演员(actor)不同的是,CTM 在意识舞台上总是一个相同的演员,该演员可以提出或回答任何问题,或传达任何种类的信息,但扮演获胜的那部分作为最终广播的脚本。


在意识图灵机中,世界建模处理器(The model-of-the-world processor)是一个多模态处理器的例子,它将代理主体从物理世界观察到的多感官信息整合成一种多模态表示(gist),计划对世界上可能的行动,并根据其行动对世界的影响来更新自己(即通过观察新的状态和奖励作为其行动的结果。

有关 CTM 的算法实现,参照:
https://www.notebookarchive.org/implementing-blum-s-conscious-turing-machines--2021-07-61dzgpq/



此外,华院计算技术(上海) 股份有限公司自然语言处理算法研究员蔡华还做了「探索有个性、有情感的数字人对话技术」的分享。

本次《认知智能改变世界》论坛的直播回放可以通过官网平台进行观看:https://online2022.worldaic.com.cn/forumdetail?uuid=7c8b44fed42a43fa98d2965f758f88f9

作者:心识宇宙团队

研读 | WAIC2022回顾 (1):AI 助力元宇宙 3D 重建与内容生成城市棱镜 | “信息化城市”的时空观变革


研读 | 张兆曙:参与困境、场景升级与数字乡村的全景治理——对湖州市“数字乡村一张图”治理平台的案例研究


内容来源 / Mindverse Research,2022年10月15日

今日编辑 / 范姝含

责任编辑 / 戴晟昱

审稿 / 杨武剑

城市大脑研究院提供开放研讨平台,所有文章仅代表作者个人观点,欢迎共同探讨。原创文章,转载请注明来源:城市大脑研究院。部分图片来源于网络,如涉及版权问题,敬请及时联系我们。

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存