查看原文
其他

《线性代数应该这样学》学习小结






数学算法俱乐部

日期2020年04月13日

正文共:2506字0图

预计阅读时间:7分钟

来源:原创


该书英文名Linear Algebra Done Right
本文作者邮箱:  omnitomato@gmail.com
"近年来最具创新性的线性代数教材,每一位大学生都不可错过. "

这是写在中译版背后的语录.冲着“每一位大学生”,我开始读这本书.原本只是为了复习一下已经忘得差不多的大一课程,但事实证明,这“复习”比我当时“学习”还要累.这本书和常规教材的讲授顺序几乎是反过来的,它从公理化定义的线性空间(Linear  Space)入手,研究向量、算子(Operator)、内积(InnerProduct)以及本征值(Eigenvalue),最后再揭示了迹(Trace)与 行列式(Determinant)在整个线性代数体系中的位置和意义.整本书的思路优美流畅,既充分讲 述了线代的内容,又对线代的外延做了适当的拓展.读完这本书,我感受到,数学各个分支有着密切的联系.傅里叶变换、拉普拉斯变换在谱定理(SpectralTheorem)的背后若隐若现;迹与行列式、韦达定理,其思想一脉相承.

这本书非常好,但是我读得并不深入,因为我没有足够的时间去深究每一个命题.这本书的作者SheldonAxler 在书的前言“致教师”里说“即便是这么薄的一本书,你也不要指望能把所有内容都讲完.一学期讲完前八章就已经是一个雄心勃勃的目标了.”所以可想而知,我三个月读完这本书是一个什么样的效果.而且我觉得读这本书理想的条件和方式是:学过一遍常规线代教材的几个人,组成一个小组,花上一年半载的时间,一起来研读这本书.因为多人讨论是一种绝佳的启 发思路的方法.可惜我只满足第一个.

因此,在这个小结里,我不想过多涉及具体的线代理论(具体理论,可以看看这个博客:http://tianpeng.72pines.com/),只是谈谈这本书给我在数学思想方法上的启示.

1.   公理化定义

这是一种抽象的定义方式.其动机可以归纳为这么几个步骤:自然定义,特征归纳,公理 化定义.以内积和范数(Norm)的定义为例: 

a.   从几何上的点积,我们有:,其中

b.   把坐标的定义域向复数拓展,同时为了保证在实数域中的结论不变,考虑到若,则有,所以定义复数域上的内积为:,其中.至此为第一步,自然定义;

c.   由前面定义的复数域上的内积,可以归纳出以下性质:(在线性代数中,把内积记为<,>)

正性:对所有,都有;定性:当且仅当;第一个位置的加性:对所有,都有;第一个位置的齐性:对所有,都有;共轭对称性:对所有,都有

这一步是归纳.尽管书上没有提,但我觉得归纳这一步,不是一次性完成的,而是在自然定义的基础上发展出一套理论后,再根据建立这套理论所需要的性质归纳出来.而对于数学思想方法的理解,则只需要知道归纳就够了;

d. 凡是符合以上性质的运算,都可以叫做内积,因此对于,可以验证是内积的一种定义.至此为公理化定义. 读完这本书,我明白了为什么以前竞赛书里往往会列举一些显而易见的性质,比如“可加 性”“自反性”,这都为公理化定义做了准备,将定义抽象化,也就便于将定理拓展到其他方面运用,比如从几何拓展到代数.

2.   线性的黑盒

"线性"是这本书中以及整个线代理论中应用最广泛的一个公理化定义.百度百科给"线性"的定义是"指量与量之间按比例、成直线的关系",这也是一直以来老师们所给的描 述,但为何要"成比例"?为何也是直线却不是"线性"?有时候,对于一个抽象却又显而易见的概念,不如从它的反面去理解.线性的反面——非线性,其实在生活、工程中随处可见.人们星期一工作,但人们星期六(把星期六看做星期一×6)不工 作;实际电压为1V 的时候,电压表显示为1V,实际电压上升到100V的时候,电压表显示为10V或者Error(反正不是100V),因为电压表爆了.所以从"非线性",我们发 现"线性"具有很好的一个性质:a.知道了一组输入、输出后,就可以推测出这一组任意倍数的输入、输出."线性"还有一个很好的性质在于:b.知道了两组输入输出后,可以 把两个输入相加(减),得到的新输出就是两个已知输出的和(差).

数学上的这种输入、输出对关系,叫做映射。我们可以把属于看成是一种映射,然后用数学语言描述线性的两个性质就是:

,则;若,则. 这就构成了线性空间的定义.

如果把映射记为T,那么这个性质就表述为:对所有都有;对所有都有.这就构成了线性算子的定义.

而在工程上,这种未知内部结构的输入输出关系,就叫做"黑盒".如果这个黑盒是线性 的,那么就有一套成熟的线代理论可以运用.这个学期所学的多输入、多输出系统的状态方程,就是线代理论的一种应用.可惜大多数黑盒都不是全局的线性,只有有效地限制研究范围,才能够保证线性性质,例如使用电压表不能超过量程.

3.   方阵与行列式(Determinant)

以前学线性代数的时候,我觉得方阵与行列式的区别就在于竖线与括号的区别;但这个区别也不甚明显,以至于我见到方阵往往就抑制不了计算行列式的冲动.但Sheldon Axler 让我从更深刻的层面上理解了方阵与行列式的区别.

方阵是一种特殊的矩阵.常规的线性代数教材太过注重矩阵里的元素,而这本书注重的是映射,矩阵只是映射的具体表达形式.如前所说,映射像是一个黑盒,是一个多输入多输出的系统,那么方阵就是一个输入数量等于输出数量的黑盒.方阵的具体元素,是黑盒的影像,取决于从什么"角度"观察黑盒.具体地,取决于的一组基(Base).

行列式的英文,determinant,有"决定因素"之意,韦氏词典用了identify这个词来定义它.其实行列式的意义,更接近于"校验值",而非"方阵的函数".为了方便,假设是复向量空间,而实际上,实向量空间上存在一个类似的定义.对于,假设的一组按照重数重复的本征值为,那么的行列式为,记为.算子的迹(Trace),意义与行列式相近,定义为.再结合算子的特征多项式,由于算子的本征值正是的的跟,因此可以发现,迹就是一元多次方程的根的和,行列式就是一元多次方程的根的积, 这两个概念与韦达定理的联系也正在于此.

结束语

与托马斯的微积分大砖头相比,这本书显得太薄了,但是作者在前言中毫不夸张地说"要是你不到一小时就读完一页的话,那就可能读得太快了."确实如此,这本书从没有像托马斯微积分一样把一个概念重复两次,所以它需要前后翻着看;而有的问题又非常抽象,必须花一定的时间去理解.一旦理解了,就会感叹,思路精巧至极!如果有时间,我想结合常规的线代教材,把这本书再读一遍.当然,前提是"如果"有时间……



— THE END —


人民币为什么没有3元?原来这是一个数学优化问题
各种机械原理动态图,看完脑洞大开,绝对涨姿势!极简西方数学史数学对于编程来说重要吗?编程大佬眼里的线性代数数学上人可以永生!这是什么原理?知乎热搜可以被人为控制吗?如果可以,怎么操作

    您可能也对以下帖子感兴趣

    文章有问题?点此查看未经处理的缓存