其他
奇异值的物理意义是什么?
数学算法俱乐部
日期:2020年05月13日
正文共:2884字14图
预计阅读时间:8分钟
来源:算法与数学之美
这是女神上野树里(Ueno Juri)的一张照片,像素为高度450*宽度333。暂停舔屏先(痴汉脸
现在我们对矩阵进行奇异值分解。直观上,奇异值分解将矩阵分解成若干个秩一矩阵之和,用公式表示就是:
其中等式右边每一项前的系数就是奇异值,
既然奇异值有从大到小排列的顺序,我们自然要问,如果只保留大的奇异值,舍去较小的奇异值,这样(1)式里的等式自然不再成立,那会得到怎样的矩阵——也就是图像?
令,这只保留(1)中等式右边第一项,然后作图:
矩阵表示一个450*333的矩阵,需要保存个元素的值。等式右边
下面可以回答题主的问题:奇异值往往对应着矩阵中隐含的重要信息,且重要性和奇异值大小正相关。每个矩阵都可以表示为一系列秩为1的“小矩阵”之和,而奇异值则衡量了这些“小矩阵”对于的权重。
在图像处理领域,奇异值不仅可以应用在数据压缩上,还可以对图像去噪。如果一副图像包含噪声,我们有理由相信那些较小的奇异值就是由于噪声引起的。当我们强行令这些较小的奇异值为0时,就可以去除图片中的噪声。如下是一张25*15的图像(本例来源于[1])
奇异值分解还广泛的用于主成分分析(Principle Component Analysis,简称PCA)和推荐系统(如Netflex的电影推荐系统)等。在这些应用领域,奇异值也有相应的意义。
考虑题主在问题描述中的叙述:“把m*n矩阵看作从m维空间到n维空间的一个线性映射,是否:各奇异向量就是坐标轴,奇异值就是对应坐标的系数?”我猜测,题主更想知道的是奇异值在数学上的 几何含义,而非应用中的 物理意义。下面简单介绍一下奇异值的几何含义,主要参考文献是美国数学协会网站上的文章[1]。
下面的讨论需要一点点线性代数的知识。线性代数中最让人印象深刻的一点是,要将 矩阵和空间中的 线性变换视为同样的事物。比如 正对角矩阵作用在任何一个向量上
其几何意义为在水平
那么, 我们也总可以找到一组网格线,使得矩阵作用在该网格上仅仅表现为拉伸变换,而没有旋转变换
很遗憾,此时我们再也找不到一组网格,使得矩阵作用在该网格上之后只有拉伸变换(找不到背后的数学原因是对一般非对称矩阵无法保证在实数域上可对角化,不明白也不要在意)。我们退求其次,找一组网格,使得矩阵作用在该网格上之后允许有 拉伸变换和 旋转变换,但要保证变换后的网格依旧互相垂直。这是可以做到的
这样就得到矩阵的奇异值分解。奇异值和分别是和 的长度。很容易可以把结论推广到一般维情形。
下面给出一个 更简洁更直观的 奇异值的几何意义(参见[2])。先来一段线性代数的推导,不想看也可以略过,直接看黑体字几何意义部分:
假设矩阵的奇异值分解为
其中是二维平面的向量。根据奇异值分解的性质,线性无关,线性无关。那么对二维平面上任意的向量
当作用在
令,我们可以得出结论:如果
推广到一般情形:一般矩阵将单位球变换为超椭球面,那么矩阵的每个奇异值恰好就是超椭球的每条半轴长度。
参考文献:
[1] We Recommend a Singular Value Decomposition(Feature Column from the AMS )
[2] 徐树方,《矩阵计算的理论与方法》,北京大学出版社。
— THE END —
☞马尔可夫链☞圆脸比瓜子脸好看的证据,不得不服!☞他用“1 和 0”解决了人类两大难题,他是信息论之父,却渴望做“杂耍博士”☞施一公:没有高考,就没有一批非常优秀的社会精英从农村走出来☞知乎热搜可以被人为控制吗?如果可以,怎么操作