查看原文
其他

刘润对话吴军:信息时代,每个人都必须了解的基本常识

刘润 刘润 2021-03-20

▲ 点击上方第二个“刘润”关注公众号

回复“1”抽取签名书


商业洞察 丨作者 / 刘润   整理 /  由之

这是刘润公众号的第1017篇原创文章



在机械时代,关于物理世界的一些常识,只要学过中学物理,我们基本都了解。

比如,速度不能超过光速。温度不会低于绝对零度(-273摄氏度)。发动机的效率不可能超过100%。

正因为有了这些常识,大家就会知道做一件事情可以做到什么程度,比如汽车的效率能提升到多少。我们就不会去追求那些不可能达成的目标。

但是,今天到了信息时代,关于信息有什么规律和常识,很多人其实是不了解的。

因为不了解,所以就容易产生错误的判断。

比如,一个会场的wifi网络每秒能传输10M的数据。如果同时上网的人特别多,大家会惯性地觉得,人多就多吧,只是平分到每个人身上的速度慢一点,比如100k/s,但总归是能上网的。

其实,完全不是这样。

当所有人传输的信息总量超过一个阈值,所有人都会上不了网。

这是由香农第二定律决定的:

如果信息传输率超过信道容量,就不可能实现可靠传输。这个时候,谁也传不出去任何信息。

这就是信息时代的规律和常识。

再比如,有人说,埃隆·马斯克发射了很多卫星,一旦覆盖全球通信,就能取代5G了。

乍一听好像有点道理。

但其实完全是两回事儿。

因为,从卫星到地面的信道容量是很有限的,它可以用来解决南北极、珠穆朗玛峰等极端地区的通信问题,但是速度完全没法跟5G相比。

很多人不了解信息时代的这些基本常识,所以才会有这种不切实际的对比。

不切实际的对比倒也无伤大雅,但是有一部分人会去做一些不切实际的投资,甚至不切实际的创业。

这其实就是在做类似超越光速的事情,永远都不可能达成目标,会浪费很多金钱和生命。

类似的事情,在机械时代,大家因为了解物理常识,会嘲笑他是民科。

但是在信息时代,很多人因为不了解信息常识,反而就会觉得他在创新。

所以,为了让大家了解信息时代的基本常识,吴军老师写了一本书,叫做《信息传》。

吴军老师是计算机科学家,是自然语言处理技术的先驱者,是谷歌公司的智能搜索科学家,腾讯公司的前副总裁,同时也是硅谷著名的风险投资人、畅销书作家。 

他著有《数学之美》、《浪潮之巅》、《硅谷之谜》、《智能时代》、《文明之光》、《大学之路》、《全球科技通史》、《见识》、《态度》等,本本都是超级畅销书。从我到我儿子小米,我们全家都是他的书迷。 

吴军老师的这本《信息传》,我一拿起来就放不下来了。

因为它讲了很多信息时代的基本规律。

比如,为什么一次性密码最安全?为什么量子通信今天这么热门?数据压缩到什么程度会有损耗?

这些规律和常识,就相当于机械时代的牛顿三大定律一样重要,每个人都应该了解它们。

拿到这本书后,我专门访谈了吴军老师,让他给我们公号的读者讲讲他的《信息传》。

非常感谢吴军老师。

今天,我就把这次访谈的内容,分享给你。





 1 


信息科学的发展,大致可以分为两个阶段。一个叫自发的时代,一个叫自觉的时代。在自发时代,虽然人类有了电报、电话、无线电、电视机以及机械计算机等信息技术的成就,但是人类并不了解信息的本质和规律,因此依然处在黑暗中的摸索阶段。在那个时候,哪怕是最好的科学家,也和今天的常人一样,在犯同样的错误。比如像特斯拉和巴贝奇这样的天才,他们完全无法明白自己的很多努力,其实完全走错了方向。特斯拉一直致力于用电磁波来传递能量,而特斯拉的竞争对手马可尼,则致力于用电磁波来传递信息。最终,马可尼的研究获得了诺贝尔奖,收获了巨大成功。到了今天,我们知道,用电磁波来传能量几乎是不太可能的,因为电磁场辐射衰减得很快,距离稍微远一点,就不剩下多少能量了。而用电磁波来传信息却是非常可行的。但是在那个时代,没有人了解信息的规律,大家都在黑暗中摸索前行。成功,具有很大的偶然性。与其说马可尼比特斯拉水平更高,不如说比他更加幸运,无意中做的一些事情,恰好契合了信息科学的发展。再比如,巴贝奇最早做计算机,其实就走错了方向。因为他并不清楚,越是复杂的信息处理,就越要用简单的基本模块去实现。在机械时代,大家普遍有一个误区:为了实现复杂的功能,就要把机器做得特别复杂。于是,巴贝奇把计算机设计得越来越复杂,用无数的齿轮来实现微积分,最后复杂到连做都做不出来了。再后来,香农在这个问题上,换了一种思路,他想着用最简单的模块,来搭建复杂的系统。这为后来电子计算机的诞生,奠定了基础。今天我们的所有电子产品,你把它拆开来看,芯片上都是一些很简单的功能模块,最底层的就是0和1的开关电路,只是数量很多而已。在自发时代,由于不了解信息的本质和规律,人们都在摸索中前行,盲打莽撞。直到香农用一个被称为“熵”的概念,和三个非常简洁的定律,描述了信息科学的本质。它们,就是我们今天所说的信息论的核心。信息时代的信息论,就像是机械时代的牛顿三大定律。有了信息论,所有的技术研究和发展就不再是凭运气,而是顺应规律。信息技术开始飞速发展。这就进入了信息科学的自觉时代。人类从此几乎没有再犯过什么大的错误,也没有走太多的弯路。



 2 


在自觉时代,我们要感谢三位非常重要的科学家,他们为今天的信息技术奠定了理论基础。

第一位科学家,毫无疑问,就是香农。

他做出的重要贡献之一,就是提出了著名的香农第二定律,解释了信息传输的规律。

具体来说,就是:

信息的传输率永远都不可能超过信道的容量。

你可以把传输率理解为通信(上网)速度,也就是每秒能传输的信息量,比如200kb/s。

信道的容量,你可以把它想象成高速公路的宽度。高速公路上行驶的汽车就相当于在信道中传输的信息。

信息的传输率永远都不可能超过信道的容量,一旦超过,出错率就是100%,所有人都会无法通信。

那么我们想要传输率更快,就要增加信道的容量。

如何增加信道的容量?

有两个办法。

第一个办法:增加频率范围,也就是带宽。

频率范围,就是带宽。比如100兆赫-200兆赫,就是一段频率范围。

频率范围,也就是带宽越大,信道的容量越大。

光纤通信相比无线电通信和电缆通信,信息传输率可以高出很多,根本原因就是它的带宽要比后两者宽了很多。

光纤通信用的是可见光,而光的频率比无线电通信中电磁波的频率要高很多。

同样是无线电通信,从1G到5G,它的频率是不断提高的。

因为我们想要增加带宽,让频率范围往上走是有很大空间的,但是往下走的空间却很有限,最多频率降到零,但不可能是负的。

4G的发射频率大概是2000兆赫。

到了5G,发射频率增加到6000兆赫左右。美国下一代的还要到28000兆赫。


增加信道容量的第二个办法,就是增加信噪比。

信噪比越高,信道的容量越大。

信噪比,顾名思义,就是信号和噪声的比值。

想要信噪比越高,就要增加信号的强度,或者降低噪声。

增加信号强度,可以从加大发射功率入手。

但是这种做法是有极限的,比如我们的移动通信基站,功率太大会对周围的人造成辐射伤害,所以必须把它限制在安全范围内。

在无线通信中,信号的强度会随着距离的增加而衰减,噪声则是恒定不衰减的。

所以,想要在不增加功率的情况下,增加信噪比,唯一的方式就是缩短通信的距离。

这就是5G的基站要建得非常密集的原因之一。

增加频率范围和增加信噪比,是增加信道容量的两个基本方向。

从1G到5G,大家都是在朝着这两个方向走。所有关于5G的创新,其实都是在解决这两个方向上所遇到的工程问题。

再过十几年,又会出现6G,6G也是在这两个方向上的进一步延伸。

因为这是信息时代的基本规律,朝着这两个方向走,就不会有失败。





 3 


在自觉时代,我们要感谢的第二位科学家,叫做冯·诺依曼。

冯·诺依曼,他解释了信息和运算的关系。

信息不仅仅是用来传输的,我们想要让信息发挥更大的作用,还要解决另外两个问题:信息的运算和存储

冯·诺依曼从工程学的角度,把信息的运算和存储切割开来,每一块单独设计,再结合在一起来实现计算机的完整计算功能。

按照冯·诺依曼的设计思想,一台电子计算机应该包括计算器、控制器、存储器和输入输出设备,它是由程序自动控制的。

这就是所谓的冯·诺依曼结构,这个结构是现代计算机的基础。

今天所有关于计算机的研究工作,依然在冯·诺依曼所划定的框架内做改进。

比如处理器是一个还是多个,存储器是少量的还是海量,处理器和存储器是单独放置还是做到一个芯片中,这些都是后来改进时需要考虑的问题了。

当然,今天计算机的性能,已经和冯·诺依曼那个时代不可同日而语。

全球第一台电子计算机ENIAC,是在1946年完工的。这台计算机占地近160平方米,每秒能运算5000次。

到今天,你知道一台iPhone12,每秒能计算多少次吗?

大概能计算200亿次。

从每秒计算5000次,到每秒计算200亿次,是怎么实现的?

这就是芯片的工艺问题了。

芯片是由晶体管组成的,晶体管可以实现电门的开和关,也就对应着计算机中的0和1。

一块芯片有多大的计算能力,就看这块芯片上的晶体管有多密集。

以华为麒麟970和华为麒麟980为例。

麒麟970是10纳米工艺的芯片,有55亿个晶体管。

麒麟980是7纳米工艺的芯片,有69亿个晶体管。比麒麟970性能提升了25.5%左右。

在同样大小的一块芯片里,7纳米工艺的芯片,比10纳米工艺的芯片能搭载更多的晶体管,技术更先进,性能更高。

今天,台积电和三星的量产芯片可以做到7纳米,接下来将量产5纳米。

所以,在冯·诺依曼提出计算机的结构之后,后人都是在这个结构的基础上改进技术和工艺。

在信息的存储方面也是同样。

怎么来解决信息的存储问题?

最早是通过在纸带上打孔的方式,把运算过程记录下来。

后来演变成磁带。

比如我们小时候听歌时用的磁带,就是把歌曲的信息存储在了磁带上。

再后来有了磁盘。

我上小学四五年级的时候买过一张5寸的单面磁盘,当时花了8块钱,存储空间是180K。

再后来,5寸磁盘演变成了3寸磁盘。

再往后又演变成了硬盘。

我高中时用过的第一台带硬盘的计算机,硬盘的存储空间是10M。

到了我上大学,计算机的硬盘已经能达到1个G了。

而今天,一部手机的存储空间,已经能达到512G。

这就是存储的进步。

这也是在冯·诺依曼结构的基础上,存储技术和工艺的改进。





 4 


在自觉时代,我们要感谢的第三位科学家,叫做图灵。

他提出了著名的“图灵测试”,定义了数据和智能的关系:

如果机器能够与人类展开对话而不被辨别出其机器身份,那么称这台机器具有智能。

通过了图灵测试,就说明对方的智能是不是能达到人类的水平,而不一定非要模拟人类的思考行为。

在过去,我们认为,数据产生信息,信息产生知识,知识产生智慧。

但是图灵告诉我们说,不需要通过知识产生智慧,从数据就能够直接产生智慧。

这是这么意思?

我举个例子。

如果让一个人来判断,路上的一个小动物是不是一只猫。人是怎么判断的?

首先,你得先见过猫,你眼睛看到的所有东西,都是数据。

接着,你的大脑从这些数据中收集到猫的一些信息:猫的眼睛是什么样,耳朵是什么样……

然后,你总结出了一套知识:符合什么特征的动物,就是猫。

于是,你就拥有了智慧:你看到一只猫,就能辨认出这是一只猫。

这是从数据,到信息,到知识,到智慧。

人类想要机器也拥有智慧,一开始也想让机器走这条路径。

但是发现,这条路是走不通的。

后来一想,不对,为什么一定要这么走呢?我们能不能从数据直接到智慧呢?

于是,有人提出了一种算法,叫做深度学习。

我拿1000万张猫的照片,让人工智能来看,这是不是猫?

人工智能判断对了,我就告诉它对了。人工智能判断错了,我就告诉它错了。

通过海量的反馈,让人工智能训练出一套有效的模型。

一开始,它随机判断,准确率可能是1%。

慢慢地,训练数据和反馈越来越多,准确率也慢慢提高。

2%,5%,10%……最后准确率提高到95%,甚至98%。接近甚至超过人类的准确率。

这个时候,模型就训练好了。

人工智能就能够准确地判断这张照片上的动物,到底是不是猫。

这就是从数据,直接到智慧。

你给人工智能一张照片的数据,它虽然能判断照片上的动物是不是猫,但是它根本就不知道什么是猫。

这就是今天的人工智能。

图灵用图灵测试的方法让我们知道,我们应该怎么去对待数据,怎么去对待信息,怎么去对待知识,怎么去对待智慧。

理解了这些,你才能理解人工智能时代的基本常识。




最后的话


今天的文章,我们给大家介绍了三个人。

首先是香农,他解释了信息传输的规律。

然后是冯·诺依曼,他解释了信息和运算的关系。

最后是图灵,他定义了数据和智能的关系。

理解了他们的理论,你才能了解今天信息时代的基本常识。

而只有了解了这些常识,你才能在未来的工作、创业中,遵循信息时代的基本规律,不至于去追求一些永远不可能达成的目标。

你做事情才能事半功倍。

如果你想要了解更多信息时代的基本常识,推荐你去看吴军老师的新书《信息传》,非常精彩。

最后,再次感谢吴军老师。

如果你想要阅读吴军老师的《信息传》,可以点击文末左下角的“阅读原文”购买。





 花半秒钟就看透事物本质的人,

  和花一辈子都看不清的人,
  注定是截然不同的命运。


长按二维码关注,和100万读者一起

洞察商业本质



▲ 长按关注刘润,洞察商业本质



品牌推广 培训合作 | 商业咨询 | 润米商城 | 转载开白

请在公众号后台回复  合作 


长按识别下方二维码,和17000位岛民一起

把别人的顿悟,变成你的基本功

    您可能也对以下帖子感兴趣

    文章有问题?点此查看未经处理的缓存