瞎扯现代数学的基础

查看原文

其他

瞎扯现代数学的基础

算法数学之美 2019-05-25

算法数学之美

日期：2018年12月20日

正文共：17809字 6 图

预计阅读时间： 45 分钟

来源：豆瓣 wxmang

我想尽可能不用数学符号，瞎扯一下现代数学的基础。这篇帖子更多是从认识论的角度，用数学为例子解释人类思想能够达到的边界和逼近边界的过程。不完全是在介绍数学。不过我也不知道是否足够通俗易懂

写这个帖子的另外一个目的就是想说明数学除了是工程师的计算工具，物理学家的建模和解释工具，他是能够单独存在的，是具有智力审美价值的，不是仅仅只是一些数值计算和逻辑证明，更多的是对人类思想极限的挑战。当然由于是瞎扯，就不能深入，而且这里不能用数学符号，所以也无法具体介绍过程。

以前我说过，大学工科学习的所谓高等数学，其实还是初等数学，不过是学会了怎么计算初等函数的微分（例如加速度，边际效益等等）和积分（例如体积，面积，重量），也能用行列式解一次方程组，有的可能还能计算傅利叶变换等等，但是也只是掌握一点计算工具而已，大多数学生还是无法了解这些工具是怎么构造的，是怎么来的。

数学系的学生当然也要学习计算，但是在整个课程中占的比例极少，可能不到5%，大多数时间，还是在学习如何构造工具现有工具的来龙去脉，但是更重要的是在培养一种精细的思维方式和逻辑结构框架，只有具备了这些思维方式和逻辑框架，人才能超越直觉和常识，进入一种抽象的审美境界（当然达到这个境界的人不多，因为达到了，就是大数学家了）。

下面瞎扯一点基于数学系学生的角度了解的现代数学基础。

1、数学是什么

先扯扯我认为的数学是什么。

我们在中学，学习的数学定义是：数学是研究空间形式和数量关系的科学（也即数学是研究客观规律的科学），其实这个定义是不对的，柯朗就认为数学不能通过语意学定义。

我不认为数学是一种技术（当然可以作为计算工具和计算技术），也不是一门科学（当然可以作为物理学，化学，生物学等等科学的工具存在），数学是独立于所有学科的一个存在（独立于哲学，科学，文学，艺术等等）。举例来讲，很多学科的基础定理或原则，如果不存在人，可能就不存在，因为依赖于人的参与，甚至物理学也是如此，没有人的观测，物理学的基础可能就不存在，但是数学不同，例如π这个常数，不管是不是有人，甚至是不是有地球，有时间，有宇宙，都是存在的。

所以我认为数学更是一种人类认识世界的思想和一种思维方式。这种思维方式的特殊性在于他不是实证的，也不是形象类比的，而是基于逻辑的高度抽象，其概念完全可以没有任何现实背景，而仅仅是语义上的概念或凭空定义的概念，完全可以脱离现实而独立存在。

法国数学家普洛克鲁斯（P roclus）认为数学是：她提醒你有无形的灵魂；她赋予她所发现的真理以生命；她唤起心神,澄净智慧；她给我们的内心思想添辉；她涤尽我们有生以来的蒙昧与无知。

2、康托的朴素集合论

现代数学的基础是集合论。

现代数学不管是分析，几何，代数，还是其他专业，其基础就是集合论。因为现代数学基础语言、基础结构和基础表达方式就是集合。

朴素集合论是德国数学家康托(G.Cantor)于19世纪末创立的。

康托创立集合论，是基于解决微积分的逻辑基础问题（微积分的逻辑基础问题以后有机会介绍），为了使微积分里面采用的无穷小概念有一个清晰的逻辑基础，康托开始定义实数点集，并在上面定义了算法，进一步对其性质就行研究，把成果在发表在1874年的《克雷尔数学杂志》上，这一系列论文是奠定现代数学基础的革命性成果。

康托要做这个工作，是因为不管是牛顿，还是莱布尼兹所创立的微积分理论逻辑上都是不严格的，两人的理论都建立在无穷小分析之上，但他们对作为基本概念的无穷小量的理解与运用却是混乱的（例如牛顿就认为它必须既是0，又不是0）。

贝克莱大主教对牛顿的理论进行了攻击，其中就是贝克莱悖论（无穷小量究竟是否为0），其实本质就是有限与无限，无穷小与零，零与非零的逻辑矛盾。

由于无穷概念没有精确的定义，微积分遇到严重的逻辑困难，19世纪初，法国数学家柯西企图用极限概念来弥补这个缺陷。给出了极限的定义：若代表某变量的一串数值无限地趋向于某一数值时，其差可任意小，则该固定值称为这一串数值的极限。并在极限这基础上建立起连续、导数、微分、积分以及无穷级数的理论。

但是，柯西并没有彻底完成微积分的严密化，柯西的思想会产生逻辑矛盾。19世纪后期的数学家们发现使柯西产生逻辑矛盾的原因是奠定微积分基础的极限概念上。严格地说柯西的极限概念并没有真正地摆脱几何直观，并没有确实地建立在纯粹严密的算术的基础上。

于是，许多大量的数学家开始致力于微积分的严格化，柯西之后，魏尔斯特拉斯，戴德金也做过类似工作，但是进展不大，责难不少。在这一过程中，他们都发现一定要涉及对微积分的基本研究对象----连续函数的描述，这是一个绕不过去的坎，因为在数与连续性的定义中，必须涉及无限集合这个概念。

因此，无限集合就成为数学严密化的拦路虎。所以为寻求微积分彻底严密的算术化，必须解决无限集合的性质，这成了集合论产生的一个重要原因。

对无穷小的最深刻责难是黎曼在1854年的就职论文《关于用三角级数表示函数的可能性》中首次提出唯一性问题：

如果函数f（x）在某个区间内除间断点外所有点上都能展开为收敛于函数值的三角级数，那么这样的三角级数是否是唯一的？

函数可用三角级数表示，最早是1822年傅立叶提出来的。此后对于间断点的研究，越来越成为分析领域中引人注目的问题，从19世纪30年代起，不少杰出的数学家从事着对不连续函数的研究，并且都在一定程度上与集合这一概念挂起了钩。这就为康托最终建立集合论创造了条件。

1870年，海涅证明：当f（x）连续，且它的三角级数展开式一致收敛时，展开式是唯一的。海涅然后进一步证明：如果表示一个函数的三角级数在区间[-π,π]中去掉函数间断点的任意小邻域后剩下的部分上是一致收敛的，那么级数是唯一的。进一步的问题是：当f（x）具有无穷多个间断点时，唯一性能否成立？这个问题海涅没能解决。海涅推荐康托来解决这个问题。

所以康托建立集合论的出发点问题是：任意函数的三角级数的表达式是否唯一？
为了给出最有普遍性的解，康托引进了一些新的概念。康托实际上就是就是通过对这个唯一性问题的研究，认识到无穷集合的重要性，并开始从事无穷集合的一般理论研究。直到康托利用实数集合建立了完整的实数体系，才完成了微积分的逻辑奠基工作。

在其后的三年中，康托先后发表了五篇有关这一题目的文章。康托先在1870年和1871年两次在《数学杂志》上发表论文，证明了函数f（x）的三角级数表示的唯一性定理，而且证明了即使在有限个间断点处不收敛，定理仍然成立。1872年他在《数学年鉴》上发表了一篇题为《三角级数中一个定理的推广》的论文，把海涅的一致收敛的严酷条件推广到允许间断点是某种无穷的集合的情形。为了描述这种集合，他首先定义了点集的极限点，然后引进了点集的导集和导集的导集等有关重要概念。康托1872年的论文是从间断点问题过度到点集论的极为重要的环节，使无穷点集成为明确的研究对象。这是从唯一性问题的探索向点集论研究的开端，并为点集论奠定了理论基础。

下面稍微介绍一下康托的工作。

康托对集合的定义：把若干确定的，有区别的（不论是具体的或抽象的）事物合并起来，看作一个整体，其中各事物称为该集合的元素（其实现代系统论定义系统也是基于康托对集合的定义，只是系统有目标）。

为了彻底解决无穷小的逻辑问题，康托29岁（1874）时在《数学杂志》上发表了一篇论文《论所有实代数数集体的一个性质》。

在这篇论文中，康托的第一个要解决的问题是：正整数的集合（n）与实数的集合（x）之间能否把它们一一对应起来。1873年12月7日，康托写信给戴德金，说他已能成功地证明实数的“集体”是不可数的，也就是不能同正整数的“集体”一一对应起来。这一天应该看成是集合论的诞生日。

康托的《论所有实代数数集体的一个性质》这篇文章1874年发表，提出了“可数集”概念，并以一一对应为准则对无穷集合进行分类，证明了如下重要结果：

一切代数数是可数的；

任何有限线段上的实数是不可数的；

超越数是不可数的；

一切无穷集并非都是可数的，无穷集同有穷集一样也有数量（基数）上的区别。
上述结论的意思是：代数数集和有理数集是可数的和实数集是不可数的。这是一个超出直觉和想象力的结果。

为证明上述定理，康托假设了连续统公理（Cantor公理，后来被哥德尔证明与策梅洛选择公理协调）。

连续统公理：无穷集合中，除了整数集的基数，实数集的基数是最小的。（实数集即直线上点的集合为连续统）

利用连续统公理，康托证明：任何一个集合的幂集(即它的一切子集构成的集合)的势都大于这个集合的势，人们才认识到无穷集合也可以比较大小。

自然数集是最小的无穷集合，自然数集的势记作阿列夫零。康托证明连续统势等于自然数集的幂集的势。

是否存在一个无穷集合，它的势比自然数集的势大，比连续统势小？这个问题被称为连续统问题。

康托尔猜想这个问题的解答是否定的，即连续统势是比自然数集的势大的势中最小的一个无穷势，记作C1；自然数集的势记作C0。这个猜想就称为连续统假设。（这个假设后来得到证明）

这篇文章所用的方法是康托集合论。

康托的集合论是从定义一个元素o和集合A之间的二元关系开始的：若o是A的元素，可表示为o ∈ A。上述关系也可以用在集合和集合的关系。

另外一种二个集合之间的关系，称为包含关系。若集合A中的所有元素都是集合B中的元素，则称集合A为B的子集，符号为A⊆ B。例如{1,2} 是{1,2,3} 的子集，但{1,4} 就不是{1,2,3} 的子集。依照定义，任一个集合也是本身的子集，不考虑本身的子集称为真子集。集合A为集合B的真子集当且仅当集合A为集合B的子集，且集合B不是集合A的子集。

数的算术中有许多一元及二元运算，集合论也有许多针对集合的一元及二元运算：

集合A和B的并集，符号为A ∪ B，是在至少在集合A或B中出现的元素，集合{1,2,3} 和集合{2, 3, 4} 的联集为集合{1, 2, 3, 4} 。

集合A和B的交集，符号为A ∩ B，是同时在集合A及B中出现的元素，集合{1,2,3} 和集合{2, 3, 4} 的交集为集合{2, 3} 。

集合U和A的相对差集，符号为U \ A，是在集合U中,但不在集合A中的所有元素，相对差集{1,2,3} \ {2,3,4} 为{1} ，而相对差集{2,3,4} \ {1,2,3} 为{4} 。当集合A是集合U的子集时，相对差集U \ A也称为集合A在集合U中的补集。

集合A和B的对称差，符号为A △ B或A⊕B，是指只在集合A及B中的其中一个出现，没有在其交集中出现的元素。例如集合{1,2,3} 和{2,3,4} 的对称差为{1,4} ，也是其并集和交集的相对差集(A ∪ B) \ (A ∩ B)，或是二个相对差集的联集(A \ B) ∪ (B \ A)。

集合A和B的笛卡儿积，符号为A × B，是一个由所有可能的有序对(a,b)形成的集合，其中第一个是A的成员，第二个是B的成员。例如{1, 2}和{red, white}的笛卡儿积为{(1, red), (1, white), (2, red), (2, white)}。

集合A的幂集是指是以A的全部子集为元素的集合，例如集合{1, 2} 的幂集为{ {}, {1}, {2}, {1,2} } 。

一些重要的基本集合包括空集（唯一没有元素的集合），整数集合及实数集合。
1874年1月5日，康托给戴德金写信，进一步提出下面的问题：

是否能把一块曲面（如包含边界在内的正方形）一意地映射到一条线（如包含端点在内的线段），使得面上每一点对应线上一点而且反过来线上每一点对应面上一点？（这是一个颠覆人类想象的结论，直观说就是相当于太平洋的点与一根火柴的点一样多）。

1877年6月20日，他给戴德金写信，告诉他已经证明这个问题，信中说“我看到了它，但我简直不能相信它”。这是一个更伟大的工作，实际上证明了一条线段上的点能够和正方形上的点建立一一对应，从而证明了直线上，平面上，三维空间乃至高维空间的所有点的集合，都有相同的势。

从直观上说，平面上的点显然要比线上的点要多得多。康托自己起初也是这样认识的。但三年后，康托宣布：不仅平面和直线之间可以建立一一对应，而且一般的n维连续空间也可以建立一一对应。这一结果是出人意外的。就连康托本人也觉得“简直不能相信”。然而这又是明摆着的事实，它说明直观是靠不住的，只有靠理性才能发现真理，避免谬误。

这篇论文揭示了度量空间维数的本质，标志点集拓扑的开始。

这个工作其实揭示的是集合论里的核心难点：无穷集合这个概念本身。

从希腊时代以来，无穷集合很自然地引起数学家们和哲学家们的注意。而这种集合的本质以及看来是矛盾的性质，很难象有穷集合那样来把握它。所以对这种集合的理解没有任何进展。早在中世纪，人们已经注意到这样的事实：如果从两个同心圆出发画射线，那么射线就在这两个圆的点与点之间建立了一一对应，然而两圆的周长是不一样的。16世纪，伽俐略还举例说，可以在两个不同长的线段ab与cd之间建立一一对应，从而想象出它们具有同样的点。

他又注意到正整数可以和它们的平方构成一一对应，只要使每个正整数同它们的平方对应起来就行了:

1 2 3 4 … … n … …
1 4 9 16 … … n2 … …

但这导致无穷大的不同的“数量级”，伽俐略以为这是不可能的.因为所有无穷大都一样大。

不仅是伽俐略，在康托之前的数学家大多不赞成在无穷集之间使用一一对应的比较手段，因为它将出现部分等于全体的矛盾。高斯明确表态：“我反对把一个无穷量当作实体，在数学中是从来不允许的。无穷只是一种说话的方式… …”柯西也不承认无穷集合的存在。他不能允许部分同整体构成一一对应这件事。

但是康托认为一个无穷集合能够和它的部分构成一一对应不是什么坏事，它恰恰反应了无穷集合的一个本质特征。对康托来说，如果一个集合能够和它的一部分构成一一对应，它就是无穷的。它定义了基数,可数集合等概念。

既然n维连续空间与一维连续统具有相同的基数，于是，康托在1879到1884年间集中于线性连续统的研究，相继发表了六篇系列文章，汇集成《关于无穷的线性点集》。其中前四篇同以前的论文类似，讨论了集合论的一些数学成果，包括集合论在函数论等方面的应用。第五篇发表于1883年，它的篇幅最长，内容也最丰富。它不仅超出了线性点集的研究范围，而且给出了超穷数的一个完全一般的理论，其中借助良序集的序型引进了超穷序数的整个谱系。同时还专门讨论了由集合论产生的哲学问题，包括回答反对者们对康托所采取的实无穷立场的非难。这篇文章对康托是极为重要的。1883年，康托将它以《一般集合论基础》为题作为专著单独出版。第六篇论文是第五篇的补充。

《一般集合论基础》主要成果是引进了作为自然数系的独立和系统扩充的超穷数，从内容到叙述方式都同现代的朴素集合论基本一致，所以该书标志着点集论体系的建立。

《一般集合论基础》，引进了无穷点集的一些概念，如：基数，势，序数等，试图把不同的无穷离散点集和无穷连续点集按某种方式加以区分。康托在这篇文章中的主要贡献是引进超穷数。

为构造超穷数的序列。康托应用了以下几条原则：

第一生成原则：从任一给点的数出发，通过相继加1（个单位）可得到它的后继数。

第二生成原则：任给一个其中无最大数的序列，可产生一个作为该序列极限的新数，它定义为大于此序列中所有数的后继数。

第三（限制）原则：保证在上述超穷序列中产生一种自然中断，使第二数类有一个确定极限，从而形成更大数类。

反复应用三个原则，就得到超穷数的序列：

ω，ω1，ω2，…

利用先前引入的集合的势的概念，康托证明第一数类（Ⅰ）和第二数类（Ⅱ）的重要区别在于（Ⅱ）的势大于（Ⅰ）的势。还给出了良序集和无穷良序集编号的概念，指出整个超穷数的集合是良序的，而且任何无穷良序集，都存在唯一的一个第二数类中的数作为表示它的顺序特性的编号。康托还借助良序集定义了超穷数的加法、乘法及其逆运算。

他另外一个重要工作是构造了实变函数论中著名的Cantor集。

康托集是一个无处稠密的完备集，简单说康托集是个测度为0的集，直观的解析几何说法就是这函数图像面积为0。

通过考虑这个集合，康托奠定了现代点集拓扑学的基础。（实际上斯梅尔的马蹄映射也会形成康托集）。

最常见的构造康托集方法是取一条长度为1的直线段，将它三等分，去掉中间一段，留剩下两段，再将剩下的两段再分别三等分，各去掉中间一段，剩下更短的四段，……，将这样的操作一直继续下去，直至无穷，由于在不断分割舍弃过程中，所形成的线段数目越来越多，长度越来越小，在极限的情况下，得到一个离散的点集，这就是康托集。

康托点集的极限图形长度趋于0，线段数目趋于无穷，实际上相当于一个点集。操作n次后，边长r=(1/3)^n，边数N(r)=2^n，根据公式D=lnN(r)/ln(1/r) , D=ln2/ln3=0.631。

所以康托点集分数维是0.631。

康托集中有无穷多个点，所有的点处于非均匀分布状态。此点集具有自相似性，其局部与整体是相似的，所以是一个分形系统。

康托集具有：自相似性；精细结构；无穷操作或迭代过程；长度为零；简单与复杂的统一。

康托集的出现，导致传统几何学陷入危机。用传统的几何学术语难以描述，它既不满足某些简单条件，如点的轨迹，也不是任何简单方程的解集。其局部也同样难于描述。因为每一点附近都有大量被各种不同间隔分开的其它点存在。

康托于1895年和1897年先后发表了两篇对超限数理论具有决定意义的论文。在该文中,他改变了早期用公理定义(序)数的方法，采用集合作为基本概念。他给出了超限基数和超限序数的定义，引进了它们的符号；依势的大小把它们排成一个序列；规定了它们的加法，乘法和乘方。

但是集合论的内在矛盾开始暴露出来。康托自己首先发现了集合论的内在矛盾。他在1895年的文章中遗留下两个悬而未决的问题：一个是连续统假说；另一个是所有超穷基数的可比较性。

他虽然认为无穷基数有最小数而没有最大数，但没有明显叙述其矛盾之处。一直到1903年罗素发表了他的著名悖论。集合论的内在矛盾才突出出来，成为20世纪集合论和数学基础研究的出发点。

不过康托的集合论是数学上最具有革命性的理论，因为他精确定义和构造了数学的最基础概念：无穷集合。

康托的集合论是人类认识史上第一次给无穷建立起抽象的形式符号系统和确定的运算。并从本质上揭示了无穷的特性，使无穷的概念发生了一次革命性的变化，并渗透到所有的数学分支，从根本上改造了数学的结构，促进了数学许多新的分支的建立和发展，成为实变函数论、代数拓扑、群论和泛函分析等理论的基础，还给逻辑学和哲学也带来了深远的影响。

康托的工作一开始是不受待见的，康托集合论的出现冲击了传统的观念，颠倒了许多前人的想法，康托的成果超越了大多数人的想象边界和常识边界。

因为19世纪被普遍承认的关于存在性的证明是构造性的。你要证明什么东西存在，那就要具体造出来。因此，人只能从具体得数或形出发，一步一步经过有限多步得出结论来。至于“无穷”，许多人更是认为它是一个超乎于人的能力所能认识的世界，不要说去数它，就是它是否存在也难以肯定，而康托竟然“漫无边际地”去数它，去比较它们的大小，去设想没有最大基数的无穷集合的存在。

反对康托最激烈的是德国数学大师克罗内克（Kronecker，康托的老师）。克罗内克认为，数学的对象必须是可构造出来的，不可用有限步骤构造出来的都是可疑的，不应作为数学的对象，他反对无理数和连续函数的理论，恶毒攻击康托的无穷集合和超限数理论不是数学而是神秘主义。他说康托的集合论空空洞洞毫无内容，康托是精神病。

除了克罗尼克之外，庞加莱（Poincare）也说：“我个人，而且还不只我一人，认为重要之点在于，切勿引进一些不能用有限个文字去完全定义好的东西”。他把集合论当作一个有趣的“病理学的情形”来谈，并且预测说：“后一代将把（Cantor）集合论当作一种疾病”。

外尔（Weyl）认为，康托关于基数的等级观点是“雾上之雾”。克莱因（Klein）也不赞成集合论的思想。施瓦兹原来是康托的好友，但他由于反对集合论而同康托断交。埃里特·比修普驳斥集合论是“上帝的数学，应该留给上帝”。维特根斯坦特别对无限的操作有疑问。当罗素给出集合论的悖论出现之后，他们开始认为集合论根本是一种病态。

1884年，由于连续统假设长期得不到证明，再加上与克罗内克的尖锐对立，精神上屡遭打击康托精神崩溃，神经分裂，住进精神病院，1918年1月6日在哈勒大学精神病院去世。不过偶尔恢复常态时，他的思想变得超乎寻常的清晰，继续他的集合论的工作（他的很多重要工作都是精神病发病间歇期做出来的）。谁说数学家战斗力弱？

康托的集合论得到公开的承认是在瑞士苏黎世召开的第一届国际数学家大会上霍尔维茨（Hurwitz）明确地阐述康托集合论对函数论的进展所起的巨大推动作用，阿达玛（Hadamard），也报告康托对他的工作的重要作用。

希尔伯特(Hilbert)高度赞誉康托的集合论“是数学天才最优秀的作品”，“是人类纯粹智力活动的最高成就之一”，“是这个时代所能夸耀的最巨大的工作”。在1900年第二届国际数学家大会上，希尔伯特高度评价了康托工作的重要性，并把康托的连续统假设列入20世纪初有待解决的23个重要数学问题之首。

二十余年后，集合论价值才得到认可。二十世纪初数学家们已经普遍认为从算术公理系统出发，只要借助集合论的概念，便可以建造起整个数学的大厦。按现代数学观点，数学各分支的研究对象或者本身是带有某种特定结构的集合如群、环、拓扑空间，或者是可以通过集合来定义的（如自然数、实数、函数）。从这个意义上说，集合论可以说是整个现代数学的基础。

在1900年第二次国际数学大会上，庞加莱（这家伙改正错误倒是快得很）就兴高采烈的说：数学已被算术化了，我们可以说，现在数学已经达到了绝对的严格。

3、公理化集合论

在康托集合论得到认可的大好形势下，也有不信邪的。传说1902年英国数学家罗素（Russel）给康托写了一封信：“在一个村庄里住着一位理发师，这位理发师只给这个村庄里那些不给自己刮胡子的人刮胡子，请问这位理发师给不给自己刮胡子呢？”（也即理发师悖论），也即集合论是有漏洞的。其实不止罗素一人，当时很多数学家对数学的严密性是很怀疑的。

悖论的发现动摇了数学大厦的基础。（后面我们会介绍集合论是现代一切数学以及相关科学理论的基础）。

其实这种传说有夸张行为，罗素的工作要严谨得多。罗素构造了一个所有不属于自身（即不包含自身作为元素）的集合R，现在问R是否属于R？

如果R属于R，则R满足R的定义，因此R不应属于自身，即R不属于R；

如果R不属于R，则R不满足R的定义，因此R应属于自身,即R属于R。

这样,不论何种情况都存在着矛盾（为了使罗素悖论更加通俗易懂,罗素本人在1919年将其改写为理发师悖论）。

这样建立在集合论基础上的号称“天衣无缝”，“绝对严密”的数学就陷入了自相矛盾之中，这就是数学史上的第三次数学危机。

尽管后来在希尔伯特（Hilbert）领导下，世界上第一流的数学家们进行了100多年的基础弥补工作，但是直到今天，数学的基础仍然是晃悠的，扎实基础并未能完全建立起来。现在能够做到的就是凑合：给集合论附加了一些公理，避免悖论矛盾（这就是公理化集合论）。

公理化方法,就是从尽可能少的无需定义的基本概念（例如集合论的基本概念只有集合（set），关系（relation），函数（function），等价（equivalence）等4个）和尽可能少的一组不加证明的原始命题（基本公理或公设）出发，应用严格的逻辑推理规则，用演绎推理得到基础定理。

公理系统要求无矛盾性，完备性和独立性。也即在公理系统中不能推出自相矛盾的结论，公理系统应尽可能多地推出这门科学中已经客观存在的结论，最好是能推出全部的结论，要求基本公理不多不少，任何一条公理都不能从其他公理中推出来。

公理化的目的是在于通过一个演绎系统+基本概念+公理，获得全部定理，确保学科的逻辑严谨。

公理化集合论是1908年德国数学家策梅罗（E.Zermelo）提出的，通过集合论公理化来消除悖论。他认为悖论的出现是由于康托没有把集合的概念加以限制，康托尔对集合的定义是含混的。策梅罗认为简洁的公理能使集合的定义及其具有的性质更为显然，这就是现代数学里面的ZF公理系统（除ZF系统外，集合论的公理系统还有多种，如冯诺伊曼提出的NBG系统等）。

具体来说ZF公理系统包括（由策梅洛和A.A.弗伦克尔提出）外延公理、空集公理、无序对公理、并集公理、幂集公理、无穷公理、分离公理模式、替换公理模式、正则公理和选择公理。

利用上述公理可以定义出空集、序对、关系、函数等集合，还可以给出序关系、良序关系、序数、基数，也可以给出自然数、整数、实数等概念。

在ZF公理系统中，集合的元素都是集合，自然数可用皮亚诺公理系统表示，如3={0,1,2}={{},{{}},{{},{{}}}}。

外延公理:一个集合完全由它的元素所决定。如果两个集合含有同样的元素，则它们是相等的。

空集合存在公理:存在一集合s，它没有元素。

无序对公理:任给两个集合x、y，存在第三个集合z，而w∈z当且仅当w=x或者w=y。

并集公理:任给一集合x，可以把x的元素的元素汇集到一起，组成一个新集合。（对任意集合x，存在集合y，w∈y当且仅当存在z使z∈x且w∈z）。

幂集公理：任意的集合x，P(x)也是一集合（对任意集合x，存在集合y，使z∈y当且仅当对z的所有元素w，w∈x）。

无穷公理：存在一集合x，它有无穷多元素（存在一个集合，使得空集是其元素，且对其任意元素x，x∪{x}也是其元素。根据皮亚诺公理系统对自然数的描述，此即存在一个包含所有自然数的集合）。

替换公理：对于任意的函数F(x)，对于任意的集合t，当x属于t时，F(x)都有定义（ZF系统中唯一的对象是集合，以F(x)必然是集合）成立的前提下，就一定存在一集合s，使得对于所有的x属于t，在集合s中都有一元素y，使y=F(x)。也就是说，由F(x)所定义的函数的定义域在t中的时候，那么它的值域可限定在s中。

正则公理:也叫基础公理。所有集都是良基集。说明一个集合的元素都具有最小性质，例如，不允许出现x属于x的情况（对任意非空集合x，至少有一元素y使x∩y为空集）

选择公理：对任意集c存在以c为定义域的选择函数g，使得对c的每个非空元集x，g(x)∈x。

策梅罗的主要工作是引入了选择公理。

下面重点介绍选择公理（Axiom of Choice）：任意的一群非空集合，一定可以从每个集合中各拿出一个元素。

这是显然的命题，就象平面内两点确定一条直线易于理解。但是这个命题能演绎出一些超出人类直觉的结论,例如巴拿赫--塔斯基分球定理:

一个球，能分成五个部分，对它们进行一系列刚性变换（平移旋转）后，能组合成两个一样大小的球。

下面直观的来描述一下这个数学大厦基础公理的价值。

没有选择公理很多问题将无解。假设我们要在N个批次的轮胎中每个批次抽一个出来送检，如果N是有限的，显然没问题，但是如果N是无限的，比如N与无理数一样多，怎么办？逻辑上就不可能保证每个批次能够选出一个了，因为无穷大是无法排队的，也就是没法挨个选。而选择公理告诉我们：可以选得出来。所以这个公理非常不平凡。

1904年，策梅罗通过选择公理证明了良序定理。这个公理有极多的等价形式，例如代数中常用的佐恩引理（Zorn's Lemma），也被称为库那图斯克-佐恩引理（Kuratowski-Zorn）（在任何一个非空的偏序集中，如果任何链（即一个全序子集）都有上界，那么这个偏序集必然存在一个极大元素，可以证明与选择公理等价）。

选择公理的用途很大，许多学科的基本定理都依赖依赖于选择公理才能成立。例如泛函分析中的哈恩-巴拿赫定理(关于巴拿赫空间上的线性泛函的可扩张性)，拓扑学的吉洪诺夫定理(关于任意多紧空间的直积为紧)；布尔代数的斯通表示定理，每个布尔代数皆同构于集代数；自由群论的尼尔森定理，自由群的子群也是自由的；拓扑学的Baire 纲定理；实分析（测度理论）的Lebesgue 不可测集的存在性；泛函分析的Banach--Steinhaus 定理（一致有界定理），开映射定理，闭图像定理等等。其他还有许多定理，如果没有选择公理也不行。

现代数学中，基于集合论的基础，有数学分析（Analysis）和抽象代数（Algebra）。至于微分几何，代数几何，代数拓扑和概率论等等，他们的基础是数学分析和抽象代数，所以可以说，现代数学的基础，就是集合论。

当然公理化的集合论也是形式语义学和程序理论的基础，其实现在公理语义学是软件开发工具的基本语言。

公理化集合论建立后，希尔伯特激动万分，老泪丛横：没有人能把我们从康托为我们创造的乐园中赶出去。不过庞加莱认为一些基本问题并未获得解决：公理化集合论，仅仅是为了防备狼，羊群用篱笆围了起来，但不知道圈内有没有狼。

庞加莱这次说对了，因为哥德尔（Godel）后来又证明完备的公理系统是不存在的，所以数学大厦的基础仍然在晃悠，仍然需要修补。

顺便补充一句，ZF如果另加选择公理（AC），则所得的公理系统简记为ZFC。现在已经证明，ZF对于发展集合论足够了,它能避免已知的集合论悖论，并在数学基础研究中提供了一种方便的语言和工具。在ZF中，几乎所有的数学概念都能用集合论语言表达，数学定理也大都可以在ZFC内得到形式证明，因而作为整个数学的基础，ZFC是完备的，数学的无矛盾性可以归结为ZFC的无矛盾性。

选择公理和连续统假设有重要地位，是集合论中长期研究的课题。选择公理成为数学史上继平行公理之后最有争议的公理，连续统假设是1878年康托提出来的，简单的说，就是关于直线上有多少点的问题。

1938年，哥德尔证明了：从ZF推不出选择公理的否定，从ZFC推不出连续统假设的否定，即选择公理对于ZF，连续统假设对于ZFC是相对无矛盾的。1963年，科恩证明了选择公理对于ZF,连续统假设对于ZFC的相对独立性,即从ZF推不出选择公理,从ZFC推不出连续统假设。综合这两个结果,得出选择公理在ZF中,连续统假设在ZFC中都是不可判定的。

4、布尔巴基的数学结构

数学界另外一座公理化的高峰是法国布尔巴基学派（Bourbaki）的工作，这个是必须介绍的，没法绕过去。

20世纪30年代后期，法国数学期刊上发表了若干数学论文，所论问题深刻，内容详尽，署名为尼古拉·布尔巴基。1939年出版了一本《数学原理》，这是一套关于现代数学的综合性丛书的第一卷，水平绝对秒杀世界上大多数数学家，作者也是尼古拉·布尔巴基。

谁是布尔巴基，成为当时世界数学家的一大猜想。后来还是布尔巴基自己解密：他们就是一群年轻的法国数学家。

布尔巴基里面牛人辈出，例如韦伊（Weil）、H.嘉当（H. Cartan）、让·迪多内（Dieudonné）、薛华荔（Chevalley）、塞尔（Serre）、格罗登迪克（Grothendieck）等人。布尔巴基成员之中，产生了许多具有世界意义的数学大师，例如让·迪多内，发表了大量论文，他本人的《Treaiseon Analysis》是具有世界影响的现代分析着作；韦伊在代数数论和代数几何上的工作十分深刻，是20世纪中叶以后世界上最重要的数学家之一；H.嘉当以多复变函数和同调代数驰名天下；成员之一薛华荔，建立了李（Lie）理论和有限群之间的桥梁等等。在布尔巴基成员中，获得菲尔兹奖的有施瓦兹（Schwartz，广义函数的奠基人）、格罗申第克（Grothendick，现代代数几何学家），塞尔（Serre，《数学原本》代数部分的主要贡献者），爱伦伯格（S. Eilenderg，同调代数的制定者）。而且塞尔是世界上第一个数学“三冠王”，最重要的三个国际数学大奖——阿贝尔奖、沃尔夫奖、菲尔兹奖的获得者。

布尔巴基主要成就就是编写了多卷集的《数学原理》（超过40册），这是一部影响现代数学格局的伟大著作。

《数学原理》这本书是基于公理化基础+数学结构概念来写的，下面先介绍他们的公理化基础。

前面我们说过，数学的“公理化体系”（Axiomatic Systems）是由一组公理（Axioms）与相关定义（或规定，即Definitions）构建起来的一种逻辑演绎体系（也叫”数学结构“）。当这种数学结构是客观现象的“模型”时，基于这种数学结构的的逻辑推理能够提供关于这种客观现象的理解（洞察）与预测。

布尔巴基将空集合（Empty Set）用”Ǿ”表示，定义自然数：数字0=Ǿ（空集本身），1={Ǿ}空集作为集合的元素），2={Ǿ，{Ǿ}}，3={Ǿ，{Ǿ}，{Ǿ，{Ǿ}}}，4={......}}}}（注意，这里有4个“}”右括号），因此存在顺序关系：0≤1，1≤2，2≤3，......和包含关系0∈1，1∈2，2∈3，......（符号“∈”是包含在内的意思，即前者是后者的元素，前者包含在后者的里面）。

根据上述定义，我们有了自然数系N，整数系Z，加上定义的加法，和乘法，就继有了有理数系Q，实数系R，以及超实数系*R（注意：星号“*”必须打在实数系R符号的左上方，这是非标准分析的规矩。超实数系*R 里面包含有“无穷小”）。至此，我们有了各种数系。

布尔巴基的公理系统很复杂，下面只简单介绍一下实数系的公理系统：
代数公理：

A. 封闭律：0与1 是实数。如果a与b是实数，则a+b，ab以及 -a均为实数；
B. 交换律： a+b = b+a ab = ba；
C. 结合律： a+(b+c) = (a+b)+c a(bc) =(ab)c；
D. 单元律： 0+a = a 1a = a；
E. 逆元律： a + (-a) = 0 ， a 1/a = 1 (a≠0)；
F. 分配律： a(b + c) = ab + ac；

定义：正整数是：1，2=1+1，3 =1+1+1，4=1+1+1+1，......

次序公理：

A. 0 < 1；
B. 传递律：如果a < b以及b < c，则a < c；
C. 分配律： a < b a = b 或 b < a，其中只有一个式子成立；
D. 加法律：如果a < b 则a+c < b+c；
E. 乘法律：如果a < b，而且0 < c，则ac < bc；
F.. 求根律：如果a > 0，对于任意正整数n，存在一个实数b，使得b的n次方等于a；

完备公理：

如果A为实数集合，其中x，y属于A，而且x与y之间的任何实数均属于A，则A为一个实数区间。

然后布尔巴基在各种数系上引入不同的公理系统与相关概念的“定义”，使其成为不同的“数学结构”。例如布尔巴基利用实数系R构建“连续统”（Continium，物理量的模型），其实就是数学上的“实数轴”。再进一步构建平面坐标系（即坐标平面），再进而构建三维空间，......，等等。

简单点说，布尔巴基认为现代数学就是空集Ǿ的逻辑延伸物（也即无中生有，与中国道家的无极生太极，太极生两仪，两仪生四象，四象生八方，八方生万物是一致的）。

再说说结构。布尔巴基认为数学是研究抽象结构的理论。

结构就是以初始概念和公理出发的演绎系统。布尔巴基认为只有三种基本的抽象结构：有三种基本的抽象结构：代数结构（群，环，域……），序结构（偏序，全序……），拓扑结构（邻域，极限，连通性，维数……）。他们把全部数学看作按不同结构进行演绎的体系。

用实数举例，实数可以比较大小，也就是定义一个元素x小于或等于另一个元素y，比如记为xRy。它满足一些公理：

1、对任何x，xRx；

2、由xRy和yRx可以推出x=y；

3、xRy且yRz推出xRz。

满足这组公理的集合就被称为有序结构。

同样，实数可以加减乘除（除数不为0），所以它们满足域公理，这就是代数结构。

实数还有邻域、开集等等概念，由此可以引出极限、连续等等概念，这就是拓扑结构（即满足拓扑空间的公理）。

有些集合只有一两个结构，比如：素数集合只有序结构；整数集合没有拓扑结构；矩阵只有代数结构。

数学结构是布尔巴基学派的一大重要发明。这一思想的来源是公理化方法，布尔巴基反对将数学分为分析、几何、代数、数论的经典划分，而要以同构概念对数学内部各基本学科进行分类。他们认为全部数学基于三种母结构：代数结构、序结构、和拓扑结构。

所谓结构就是“表示各种各样的概念的共同特征仅在于他们可以应用到各种元素的集合上。而这些元素的性质并没有专门指定，定义一个结构就是给出这些元素之间的一个或几个关系，人们从给定的关系所满足的条件（他们是结构的公理）建立起某种给定结构的公理理论就等于只从结构的公理出发来推演这些公理的逻辑推论。”

于是一个数学学科可能由几种结构混合而成，同时每一类型结构中又有着不同的层次。比如实数集就具有三种结构：一种由算术运算定义的代数结构；一种顺序结构；最后一种就是根据极限概念的拓扑结构。

三种结构是有机结合在一起的，比如李群是特殊的拓扑群，是拓扑结构和群结构相互结合而成。

因此布尔巴基著作中，数学的分类不再象过去那样划分成代数、数论、几何、分析等部门，而是依据结构的相同与否来分类。比如线性代数和初等几何研究的是同样一种结构，也就说它们“同构”，可以一起处理。这样，他们从一开始就打乱了经典数学世界的秩序。

布尔巴基说：从现在起，数学具有了几大类型的结构理论所提供的强有力的工具，它用单一的观点支配着广大的领域，它们原先处于完全杂乱无章的状况，现在已经由公理方法统一起来了。由这种新观点出发，数学结构就构成数学的唯一对象，数学就表现为数学结构的仓库。

基于结构的思想，布尔巴基把代数拓扑学、同调代数、微分拓扑学、微分几何学、多复变量函数论、代数几何学、代数数论、李群和代数群理论、泛函分析等数学领域汇合在一起，形成一个整体。

布尔巴基认为，数学主要考虑抽象的数学结构，强调考虑的是对象的集合之间的关系，而对对象（元素）究竟是数、是形、是函数还是运算并不关心；只考虑抽象的数学结构，不关心对象具体是什么。这与经典数学关心具体的数学对象是大不相同的。

“数学家研究的不是客体，而是客体之间的关系。”他们感兴趣的对象是某些“集合”的“元素”以及它们之间的某些“关系”。

布尔巴基的结构数学在方法论和认识论上都有重要意义，一方面，从适当选定的少数公理能够得出在证明中特别有用的大量结论；另一方面在极为丰富多彩的数学对象中能够识别出这些结构，结果把它所带给自己的工具变成整个数学工具库的一部分。并且，数学结构是分成层次的，代数结构（如李群、群、环、域等）、拓扑结构（如拓扑空间等）、序结构（如偏序、全序、格等）是比较基本的3大类结构。两种或多种结构可以复合而成更复杂的结构，它们之间通过映射或运算联系在一起；两种或多种结构还可以同时出现在同一集合上，它们之间通过一定关系彼此相容，形成多重的结构；多重结构经过组合，就形成更为复杂的结构。

数学研究的种种对象经过分析可以发现其中的种种结构。

这样数学家的工作浓缩为要着重解决两大问题，一是对于某种类型的结构把不同构的结构加以分类；二是两种结构何时看成是同构的。

他们认为只有抽象和综合才真正导致了本来就很特殊的情况和经常掩盖着事情本质的那些现象的消失，才能够弄清楚外表完全不同的问题之间的深刻联系；进而弄清楚整个数学的深刻的统一性。例如最早被认识和研究了的结构，是由伽罗华（Galois）所发现的‘群’的结构。

布尔巴基学派产生的原因是在1914年到1918年的第一次世界大战中，法国年轻的优秀数学家们有三分之二参军上战场牺牲。所以一战结束后，法国数学已经严重落后于欧洲和世界，因为数学是个年轻人的行业，法国活下来的数学家都是老头子，他们水平还停留在20年前，对现代数学的发展一无所知，例如对莫斯科拓扑学派和波兰的拓扑和泛函分析学派一无所知，也不理解冯·诺依曼和黎兹的工作，对阿廷（Artin，抽象代数奠基人之一）、诺特（Noether，一般理想理论）所创立的抽象代数学，西格尔（Siegel）和海塞（Hasse）在任意代数数系数的二次型研究上获得重要结果，范。德。瓦尔登（Waerden）划时代的著作《近世代数学》，希尔伯特的泛函分析，巴拿赫的线性算子理论，盖尔范德、豪斯多夫等人的微分拓扑和代数拓扑，另外李群、李代数、代数数论、代数几何、现代分析（由泛函分析所推动分析）、和广义函数论、偏微分方程理论上巨大的突破都一无所知（其中代数拓扑学和微分拓扑学被称为现代数学的女王），还是只在函数论这个法国传统领域做道场，而且对法国自己的e·嘉当的工作也不理解（超出他同时代人的水平20多年）。而这个时候，德国数学突飞猛进，涌现了一批第一流的数学家，例如诺特、西格尔、阿廷、哈塞等等。当时法国最年轻一代数学家，例如韦伊、H.嘉当、让·迪多内、薛华荔、塞尔、格罗登迪克等人（这些人就是布尔巴基的第一代核心成员），不满足于法国数学界的现状，认识到了法国数学同世界先进水平的差距，他们认为必须改革法国数学，不然世界就会忘掉法国数学，使法国的二百多年大师辈出的传统中断，这就是产生布尔巴基学派的原因。

一般把传统模型数学称为第一代，结构数学称为第二代，布尔巴基写的《数学原理》创造了第二代数学。这套书有七千多页，是有史以来篇幅最大的数学巨著，包含了集合论、代数学、一般拓扑学、一元实变量函数、拓扑向量空间、积分论、交换代数学、微分簇及解析簇、李群和李代数、谱理论等卷，把代数拓扑学、同调代数、微分拓扑学、微分几何学、多复变量函数论、代数几何学、代数数论、李群和代数群理论、泛函分析等数学领域整合在一起成为一个整体，而不是各个专业。其实布尔巴基初衷只是撰写一本用于教授微积分的教材，并以此取代当时法国较为流行的分析教材，不想搞成一座摩天大厦。

《数学原理》的各分册都是按照严格的逻辑顺序来编排的。在某一处用到的概念或结果，一定都在以前各卷、各分册中出现过。全书特点是简洁而清晰，论述和证明都没有废话。所以《数学原理》能够成为标准参考书，并且是战后的数学文献中被人引用次数最多的书籍之一。

20世纪中期，世界数学界是布尔巴基集体的寡头统治的时代，在二战后的十几年间，布尔巴基的声望达到了顶峰，使法国数学在第二次世界大战之后又能保持先进水平，而且影响着整个现代数学的发展。《数学原理》成为新的经典，经常作为文献征引。布尔巴基讨论班的成果就是当时世界数学的最新成果。不过数学是年轻人的科学，所以布尔巴基成员50岁退休。

1970年左右，布尔巴基比较忽视的分析数学、概率论、应用数学、计算数学，特别是理论物理和动力系统理论开始蓬勃发展，而他们熟悉的代数拓扑学、微分拓扑学、多复变量函数论等相对平稳，数学家的兴趣更集中于经典的、具体的问题，而对于大的理论体系建设并不热衷，数学研究更加趋于专业化、技术化，在这种情况下，20世纪70年代以来，在论文中引用布尔巴基《数学原理》的人越来越少了。布尔巴基终于进入黄昏。

不过后来的数学重大进展，例如莫德尔猜想的证明、费马大定理证明，椭圆曲线是模曲线的完全证明等等都是布尔巴基数学的开花结果。在1980年以后出现的非交换几何、量子群理论、M.Gromov的群论和辛几何也少不了布尔巴基结构数学的框架。

希尔伯特说过“只要一门科学分支能提出大量的问题，它就充满着生命力；而问题缺乏则预示着独立发展的衰亡或中止。”康托也说过，“问题是数学的心脏”。而会提重要的或有价值的问题，按照陈省身说法，需要审美能力。

中国数学家目前最大问题是没有提有价值问题的能力。

华罗庚说过，问题提得好，就解决一半。很多大数学家，例如陈省身，吴文俊，丘成桐，陈希孺等人，很欣赏在课堂上提好问题的学生，吴文俊先生甚至会赞不绝口：你真的是一个好问题，好问题，多遍重复后，有时会邀请提问题学生上讲台与他共同商量解决问题，让学生在黑板上解释自己想法。陈希孺先生甚至会在黑板上开始企图解决学生的问题，直接展示大师是如何做研究的过程。

估计这篇帖子能够看到这里的不多。有十个人就不错了。

- - End - -

更多精彩：

☞ 如何向5岁小孩解释什么是支持向量机（SVM）？

☞ 自然底数e的意义是什么？

☞ 10大反直觉的数学结论

☞ 为什么要学数学？因为这是一场战略性的投资

☞ 费马大定理，集惊险与武侠于一体