查看原文
其他

手把手教你将矩阵&概率画成图

要是将每个矩阵和概率都看成对应的「图」会怎么样?本文作者带我们体验了这个简单而有趣的可视化过程。
今天我想分享一个简单的 idea,它既不新颖也不花哨。甚至很多人都有过这个想法。但是无论你有没有这么想过,我都希望你能抽出几分钟和我一起重新感受这个想法。
这个想法是这样的:
想法非常简单,但非常实用。
首先严谨地概括这个想法:每个矩阵对应一个加权二分图。所谓「图」是指顶点(点)和线的集合;「二分」是指点有两种不同的类型/颜色;「加权」是指每条线都有一个数字标记。
上图对应一个  矩阵 。右侧我画了三个绿点,分别对应矩阵  的三行,两个粉点分别对应矩阵  的两列。如果对应矩阵  中的值非零,就在绿点和粉点间画一条线连接。
例如,在第二个绿点和第一个粉点间存在一条线,因为 ,即矩阵  第二行第一列的值不为 。此外,我用非零数字标记了这条线。而第一个绿点和第二个粉点之间没有线连接,因为矩阵的第一行第二列值为零。
更明确的描述如下:
任何矩阵  都是  个数的数组。当然这是常识。但是这样的数组也可以看作函数 ,其中 ,是一组  个元素组成的集合;,是一组  个元素组成的集合。实际上,如果要描述矩阵 ,那么需要描述第  项的值。换句话说,对于每对 ,都需要给出一个实数 。这就是函数的功能啊!函数  关联每对 (如果你愿意,可以去掉字母并将其看作 ),即实数 。所以可以将  简写为 
看,矩阵就是一种函数。
如前所述,我们进一步认为  的元素是绿点,而  的元素是粉点。然后矩阵  以下图方式与加权二分图相对应:图的顶点有由  和  提供的两种不同颜色,并且每个  和  之间存在连线,连线由数字  标记。但是如果数值为零,那就省略这条边。
每个矩阵对应一个图。
当我们以这种方式可视化矩阵时,神奇的事就发生了。例如……
矩阵乘法即为沿连线向前运算。
给定两个矩阵(图) 和 ,我们可以通过将它们的图拼在一起并沿着连线进行乘法运算: 的第  项的输入,即连接  到  的线的值,是通过将沿  到  的各个边相乘并加和得到的。例如:
对称矩阵对应对称图。
如果一个矩阵等于它的转置,即为对称矩阵。这种对称性常通过矩阵对角线映射得到。但现在可以从图中观察到对称性。尤其对于任何矩阵  来说,下图直观地解释了,为什么  和  始终对称!
若矩阵所有项都非零,则对应完全二分图。
如果一个矩阵的所有元素都不为零,那么它对应的图就没有缺失的连线。这意味着  中的每个点都与  的每个点相连。这样的二分图称为完全二分图。
 分块矩阵对应独立的  个图。
具体来说,由直和得到的分块矩阵对应断开的图。将两个矩阵做直和运算得到更大的数组(与向量直和运算类似),即一个带有全零块的大型分块矩阵。分块矩阵的图通过将原矩阵的图叠加得到。
关于矩阵和图我们能展开更多的讨论,但我想通过一个不同的角度来探讨。事实证明,概率非常适合我们矩阵-图的讨论。这是通过另一个有趣的小事实来实现的:
例如:
这样的概率分布图可以让我们更好地分析。
联合概率
通过架构图中的连线,可以得到联合概率: 的概率是连接  两点的线的标签。
边缘概率
边缘概率是通过沿矩阵的行/列求和得到的(与上图等效)。例如, 的概率 ,这是第一行的总和。同样, 的概率是
 ,
是第二列的和。
图中, 的边缘概率是以  为顶点的所有连线的和。类似地, 的边缘概率是以  为顶点的所有连线的和。
条件概率
条件概率是由联合概率除以边缘概率得到的。例如在  条件下  的概率   。从图中可以看出,这是通过将  和  的连线除以所有与  相连的线之和得到的。同样, 下  的条件概率是两点连线的值除以所有与  相连的线之和。
这很简单,对吧?
这里边的原理并不复杂,只是有时用新角度看旧想法是很有用的。
关系矩阵
本文的最后是另一个简单而有趣的事实,即:矩阵运算在交换环(communicative ring)上是有意义的。不仅仅是像  或  等。矩阵相乘甚至不需要负数:矩阵运算在交换半环上是有意义的!(半环是一个没有相反数的环。)
我认为这很好,因为包含两个元素  的集合通过下图的加法和乘法形成一个半环:
为什么会这么好?因为一个矩阵  相当于一个「关系」。「关系」是笛卡尔积  的子集  的名称。换句话说,每个 -valued 矩阵定义了一个「关系」,每个关系又定义了一个 -valued 矩阵:当且仅当  是  子集的元素时,,否则 
 中的矩阵图与上面讨论的图完全相同,只是现在所有连线的值都是  或 。如果权重是 ,那和之前一样,我们就不画这条连线了。
(顺便说一句,你现在可以问,「既然每个「关系」对应于  中的矩阵,那与「等价关系」相对应的矩阵是什么样的?」我离题了....)
通过将基础(半)环从  改为 ,我们改变了解释权重的方式。例如,在上面的概率场景中,我们可以问,「从  到  的概率是多少?」答案由对应边的权重而来,在本例中为 。或者,当矩阵在  中取值时,问题变为:「是否可能从  到 ?」如果连线标记为 ,则为「是」,如果标记为  则为「否」。(这个想法已经被多次解释了)。
重要的是,「关系」的组合恰好是使用了上面的  算法的矩阵乘法。换句话说,给定任意两个关系  和 ,存在一个新关系 ,包括所有 ,至少存在一个 ,其中 。这种新关系正是表示  和  的矩阵乘积所指定的。
这个关于矩阵/关系的小事实绝对是我最喜欢的数学事实之一。一个原因是因为有限集的范畴,「关系」很像有限向量空间和线性映射的范畴。实际上,它更像是有限维希尔伯特空间的范畴。这意味着许多看似不相干的想法突然变得密切。这些联系可以更加精准,这是一个在范畴理论界经常被分享的故事。
来源:机器之心

END


往期精彩回顾

拼多多势头正猛,京东却扳回一城?
为什么淘宝、微信、百度是竞争关系?
这些数学家的生平居然如此不可思议!


让我知道你在看

    您可能也对以下帖子感兴趣

    文章有问题?点此查看未经处理的缓存