查看原文
其他

CCCF专栏 | 黄铁军:电脑前传(1):信息

黄铁军 中国计算机学会 2022-05-15

为了纪念图灵可计算性论文发表80周年,计算机发明70周年和人工智能提出60周年,2016年12月起,黄铁军教授在本刊连载《电脑传奇》四篇,被读者认为是“文采斐然的传记式史实大作”。为了追寻更早的思想源头,黄教授一直在准备《电脑前传》,终于赶在2019年来临之际奉献给大家。这一组《电脑前传》计划四篇,分别围绕信息、计算、逻辑、控制展开……



宇宙的宿命


信息是什么?


2008年开始我给北京大学信息科学技术学院本科生上课,每次都从这个问题开始。直到2012年春,才有第一位同学课间找到我说,这是他最想搞清楚的概念,而我是他遇到的第一位谈论这个问题的老师,希望我能给他提供更多的学习资料。于是,我把手上的The Information: A History, A Theory, A Flood[1]借给了他。


这本书位居《纽约时报》2011年度排行榜榜首,2013年11月被译成中文《信息简史》(我倒以为直译题目更好)出版。作者詹姆斯·格雷克(James Gleick)是科普大家,20世纪80年代,他的《混沌》(Chaos)一书曾风靡全球,让高深的复杂性科学妇孺皆知。在这本新作中,格雷克再次施展史海钩沉的能力,用信息提纲挈领,把声音、文字、词典、计算机械、电报、电话、熵、DNA、模因、量子、互联网等主题和巴贝奇、爱伦、图灵、香农、维纳、惠勒等人物钩织在一起,形成一个有机整体。遗憾的是,《信息简史》虽然丰富多彩,但也未能从根本上回答“信息是什么”这个问题。


比《信息简史》更雄心勃勃的是查尔斯·塞费(Charles Seife)的《解码宇宙》[2],其副标题是“新信息科学如何解释万物——从我们的大脑到黑洞”。该书出版于2006年,彼时《信息简史》还在策划中。客观地讲,《信息简史》中的主要观点,《解码宇宙》都讲到了,而且更为深刻鲜明。塞费也用信息作为主线,把热力学熵、麦克斯韦妖1、香农信息熵、基因编码进化、相对论光速极限、量子力学波函数叠加与塌陷、退相干、量子纠缠、黑洞、大爆炸、多重宇宙等概念贯穿在一起,描绘出一幅波澜壮阔的大画卷。在这里,宇宙不过是“一台庞大的信息处理机器——计算机”,我们的文明最终有可能掌握宇宙的所有秘密,其中最大的秘密是:我们的文明集聚的一切信息终将消散,不留下任何有意义的痕迹……

如果《解码宇宙》是一部戏剧,则这个宿命论的黑暗结尾堪称完美。但是,笔者以为《解码宇宙》最大的破绽在于,其对信息概念的理解还局限于物理层次,我们需要给“信息是什么”这个问题更全面的回答,而这个回答可能是破解宇宙黑暗宿命那把钥匙的重要线索。


信息


从人类意识到自身存在的那一刻起,信息就像空气一样如影随形。我们透彻认识空气已逾百年,而把信息作为一个对象认真思考的历史还不足百年。


从语源来看,“information”(信息)这个名词来源于动词“inform”(通知),名词表示的是从消息发出者到消息接受者之间传递的消息,动词表示的是“传递消息”这个过程。就此意义而言,“信息”是一个与认识主体(消息发出者和接受者)相关联的认识论概念。


在我国数千年历史中,“信息”这个词和音讯、消息同义,往往是为了诗词格律等目的才派上用场,例如“春来秋去相思在,秋去春来信息稀”(唐·鱼玄机《闺怨》),“香闺别来无信息,云愁雨恨难忘”(宋·柳永《临江仙·引渡口》)。


近现代以来,随着报纸、电影、广播、电视等媒体的普及,以及当代计算机、互联网的高速发展,“信息”这个词的使用频率高速增长,其形态也从语言文字、鸿雁传书和密码学扩展到了数字视听乃至虚拟现实。但在大多数人的印象中,信息也还是指有新意的消息。


1928年,拉尔夫·哈特利(Ralph Hartley, 1888—1970)首开从技术角度研究信息的先河。但他给出的信息定义也不过是“信息是指有新内容、新知识的消息”[3]。这也是信息论创始人克劳德·艾尔伍德·香农(Claude Elwood Shannon, 1916—2001)思考的出发点。1948年在信息论奠基论文《通信的数学理论》[4]中,他把信息定义为“用以消除不确定性的东西”。


对信息的这种常识性理解在哲学上属于认识论范畴。认识论探讨人类认识的本质、结构以及认识与客观实在的关系。香农的信息概念就暗含了信息的作用对象,即认识主体,也就是信宿;相应地,产生各类信息的实体称为信源;传输和存储信息的载体称为信道。换句话说,信息是连接认识主体(信宿)和客体(信源)的桥梁,信道是物质或能量的载体,信息是信道上传递的内容。


信息也是控制论的核心。同样在1948年,诺伯特·维纳(Norbert Wiener, 1894—1964)在《控制论》[5]中也从认识论的角度更明确地表达了这层意思:“信息是我们在适应外部世界、控制外部世界的过程中,同外部世界交换的内容的名称”。


认识论强调信息对人的作用,本体论则直指世界本原,是认识信息的另一哲学视角。同时,从认识论和本体论两个角度描述信息的生动例子莫过于苏轼的《前赤壁赋》:“惟江上之清风,与山间之明月,耳得之而为声,目遇之而成色,取之无禁,用之不竭。是造物者之无尽藏也”。“耳得”“目遇”是认识论,风声来自空气流动,月色来自月球对光的反射。“取之无禁,用之不竭。是造物者之无尽藏也”,是客观存在,不因苏轼的千古辞赋有所增益,也不因我等的熟视无睹而有所减损,这就是本体论。


从本体论角度看,信息是事物运动的状态和方式,而与是否被他事物所反映无关。从词源上看,information也暗含了本体论:词源inform源于名词form(形式,理型,相)。“form”是柏拉图“理型论”的核心:人类感官可见的事物,只是一种表相(form),它是完美理型(Form,至善,共相)的不完美投射。


维纳在《控制论》中给出了一个更为本体论的定义:“信息就是信息,既不是物质,也不是能量。”这个定义似乎什么都没说,但实际上隐含了很重要的一层含义:信息和物质与能量一样,是刻画这个世界的基础概念。


形式一元论


在探究宇宙物理本质的历史征程中,从德谟克利特的原子说到1803年道尔顿的原子论,实在观念长期占据主导地位。18世纪以来,实在观念的中心逐渐从物质转移到能量。1905年,爱因斯坦在狭义相对论中提出质能方程:物质不过是“凝聚的能量”。


2012年,粒子物理标准模型第62种、也是最后一种基本粒子——希格斯玻色子被发现。所有基本粒子都源于宇宙大爆炸,其中希格斯玻色子赋予其他粒子质量后就消失了,剩下的61种基本粒子作为基元构成了各种物质。


基本粒子是宇宙大爆炸能量的产物。20世纪60年代,弦论被提出,80年代发展为超弦学说,90年代升级为M理论,其基本思想是,宇宙实际上是11维的高维空间,部分维度扩张为大尺度时空结构,部分维度卷缩为基本粒子。换言之,基本粒子是以特定形态卷缩的能量,刻画这种几何形态的数学工具可能是“卡拉比-丘成桐空间2”。


正如《宇宙的琴弦》3一书所述,宇宙是一首伟大的交响乐。音乐是形式,是震荡的能量,常规音乐源自乐器弹奏,弹响宇宙这首“音乐”的是大爆炸。宇宙是一个具有特定几何形式的能量体,物质只是特定形态的能量,形式差异才是区分客观存在的更基本的概念。

客观存在的能量属性(存在本身)和形式属性(表现形态)是不可分的:任何能量的存在都必然表现为某种形式,任何形式也必须依托能量才能存在。我们可以说客观存在是“能量”(或者以稳定形式存在的“物质”),并用能量以及各种物理定律对客观存在进行刻画,我们也可以说客观存在是形式,并用对形式的描述来对客观存在进行刻画。


宇宙间能量守恒,“不增不减”,用能量转换刻画物理世界是合理的,但也仅限于物理世界。相比之下,形式则适用于刻画所有事物:因几何形态不同而不同的基本粒子(虽然目前还没找到足够强大的几何语言来描述它们)结合成亚原子粒子乃至原子,原子结合成分子,多个分子结合成大分子,有机大分子结合成细胞,不同细胞结合成生物体,生物体中部分细胞受环境影响演变成视听感知系统和神经系统,神经系统对获取的感知进行加工形成意识,一个人的意识可以传递给千万人,一个文艺作品可以集成古往今来的各种意象,各种艺术更是纯粹的形式创作、传播和演化过程,对更高级艺术语言的追求可能永无止境……


简言之,虽然任何形式都必须以能量为载体,而且任何时候都要依附在某种物质和能量载体上,但载体仅仅是载体,形式是高于载体的独立存在,可以创生、演化、融合和发展,可以“无中生有”,可以“化生万物”,创造出纷繁复杂的万事万物和自然以及社会现象。


一言以蔽之,万事万物都是宇宙这个庞大形式系统的一部分,宇宙是能量的,更是形式的。从自然宇宙,到人工创造的一切,乃至所有可能的存在,形式是唯一能够打通“形而上”与“形而下”、主观与客观的基础概念,是解决本体论与认识论、唯物论与唯心论冲突的桥梁。形式是“存在”,也是“虚无”,是“色不异空,空不异色”的色与空,是“万物生于有,有生于无”的有和无。这样的一种世界观,可称为形式一元论。


基于形式一元论,“信息是什么”这个问题就很好回答了:形式是客观存在的根本属性,是信息之源,因此,维纳才称“信息就是信息,既不是物质,也不是能量”,这是本体论。从形式一元论看认识论,认识主体和客体都是形式系统,不同形式系统之间通过交换信息(特别是与自身具有差异的形式)实现演化发展。


站在形式一元论角度看信息,百年来有关信息的各种定义和争论,就是一部从认识论过渡到本体论的历史:从哈特利的纯认识论定义(1928)到香农和维纳的争论(1948),再到1956年阿什比在《控制论引论》中提出“信息的本质是变异度”,从1975年朗高提出“信息包含在事物的差异之中,而不在事物本身”[6],再到1988年钟义信提出“信息是事物运动的状态及其变化方式的自我表述”[7]人类认识真理的过程从来不易,对信息这么基础性的概念,当然更不可能一蹴而就。


信息熵


按照形式一元论的观点,万事万物都是形式系统。刻画一个形式系统的复杂程度,最朴素直观的度量指标就是该系统可能的状态数量。在很多情况下,对绝对数量取对数,计算更为方便,我们很快会看到,采用对数描述信息量,在数学上具有唯一性。


香农提出用信息熵进行信息度量,切入点是通信工程的实际需要。他在《通信的数学理论》引言中就明确指出:“消息通常有特定的含义……与特定的物理或概念实体关联在一起。通信的语义与工程问题无关。”硬生生地把语义从消息中剥离出去,留下了更纯粹的信息:内涵缩小,外延扩大,概念更具一般性。举个不甚恰当的例子,同样的乐谱,不同演奏家的演奏效果和不同听众的感受都很难计量,但乐谱本身是客观可计量的。香农论文的焦点随后就转向了这种更纯粹的信息,更接近本体论的观点。


香农认为,实际消息是从一个消息集合中选出的,如果集合中的消息数目是有限的,那就可以用消息数目的任意单调函数来度量从集合中选择一条消息所生成的信息量。香农选择的单调函数是对数函数,他这样做的理由是:


“假定有一个可能事件集,这些事件发生的概率为p1p2, …, pn。这些概率是已知的。我们能否找到一种度量,用来测量在选择事件时涉及多少种‘选择’,或者输出中会有多少不确定性?”


如果存在一种度量,比如H(p1p2, …, pn),要求它具有以下性质是合理的:


1. H应当关于pi连续。


2.如果所有pi都相等,即pi=1/nH应当是pi的单调增函数。如果事件的可能性相等,那可能事件就越多,选择或者说不确定性也更多。


3.如果一项选择被分解为两个连续选择,则原来的H应当是各个H值的加权和。


定理:唯一能够满足上述三条假定的H具有如下形式:



其中k是一个正的常数,目的是为了度量单位。


香农信息论的重大贡献是:信息量的这种表示(在三条合理性原则下)是数学上唯一可行的选择。


关于信息量的基本单位,香农在论文中说,“如果所用底数为2,则所得到的结果可以称为二进制数位(binary digit),或者简称为比特(bit),它是约翰·图基(J. W. Tukey)提议采用的。”这个说法来自贝尔实验室1947年1月的一份备忘录。香农在信息熵定义中强制反负为正,从而使得信息量大于等于零,以比较大小。而维纳持有不同意见,认为应该直接用负数,才更符合信息的本质。


1948 年信息论创始之年,也是定义物理基本单位的起点,当年国际计量大会决定“研究并制定一整套计量单位规则”。1960 年选定六个国际单位制基本单位:长度、质量、时间、电流、热力学温度和发光强度,1973年增加物质的量:摩尔。2018年11月国际计量大会决定七个基本单位全部采用物理常数定义。比特这样的基础单位至今还未进入国际基本单位,反映出信息和物理之间的认知鸿沟。


熵与量子比特


熵是热力学创造的一个概念,即不能转化为功的能量,它是热力学第二定律的核心:封闭系统的熵总是不断增加直到最大。路德维希·爱德华·玻尔兹曼(Ludwig Eduard Boltzmann, 1844—1906)发展了通过原子性质解释和预测物质物理性质的统计力学,完美阐释了热力学第二定律,其核心就是镌刻在他墓碑上的玻尔兹曼熵:

其中k是玻尔兹曼常数,物理意义是单个气体分子的平均动能随热力学温度T变化的系数。W是可能的微观态数。


1871年,麦克斯韦在《论热能》中指出了“热力学第二定律的局限”,试图推翻热力学第二定律,即广为传播的“麦克斯韦妖”思想实验:一个封闭系统可以在一个小妖的观测控制下分成温度不同的两个区间。1929年,物理学家西拉德(Leo Szilard)提出[8]:小妖需要通过测量获得分子运动状态信息,一次“是/否”的信息测量所增加的熵,不少于因该分子有序而减小的熵,因此并不能颠覆热力学第二定律。


1940年前后,冯·诺伊曼把西拉德的论文转给香农,建议香农用熵的概念描述信息[9]。香农在论文中提到“这里的H(信息熵)可以是著名的波尔兹曼H定理中的H”,却没有提到西拉德的贡献。其实西拉德在论文中已经明确指出,通过测量确认“是/否”,也就是获得一个单位的信息,至少会增加klog2单位的熵(k是玻尔兹曼常数),可以说信息量的定义已经呼之欲出了。


应该强调的是:信息量的基本单位(比特)是一个只有两种状态且二者出现概率相同的形式系统所包含的信息量。


两种状态以等概率出现,是纯数学概念,也是物理存在,这就是量子比特(Quantum bit,qubit, Qbit)。一个量子比特被测量时,以等概率坍塌为两种本征态的任何一种。经典比特是确定的,非此即彼。量子比特是两种状态的叠加态,对它的观测结果是两种状态中的一种,但到底坍塌到哪一种,是完全随机的。构成物理宇宙的基本单元是量子,量子是不确定系统,但相互作用会发生状态坍塌(退相干过程),从而构成确定的宏观世界。


人类对信息的操作一直发生在宏观世界:结绳记事、龟甲兽骨、青铜铭器、烽火告急、石鼓撰文、锦帛传书、洛阳纸贵、活字印刷,直至“告别铅与火,迎来光与电”的方正出版系统,为了记录和传递一个比特,消耗了高昂的物质和能量代价。即便是信息技术高度发达的今天,光盘上的细小凹槽已经替代传统卡片,晶体管早已替代真空管,但是维持一个比特,DRAM(动态随机访问存储器)需要一个电容和配套电路,SRAM(静态随机访问存储器)至少需要四个晶体管,代价仍然很高。


即便未来能够通过操纵量子态,动用整个宇宙的基本粒子,我们能记录和处理的信息总量仍然是有限的。据估计[10],已知宇宙中总原子数为1080个。如果宇宙中每个粒子的每个自由度都作为一种状态表示一个单位信息,则目前宇宙记录的信息量量级大概是1090比特。根据宇宙大爆炸以来的宇宙年龄、光速和量子力学估算,宇宙已经完成的“操作”数大概是10120次量级,再经过同样量级的操作后,宇宙就将回归无极,所有信息终将消散[2]……


那把钥匙


人类诞生以来说过的所有的话约有4×1019bit (5EB)[11],当然,绝大部分已经随风消散。2010年,全球以数据形式存在的信息总量接近1021bit(1ZB),2020年将达到3.5×1022bit(44ZB)[12]。若沿用佛陀“恒河沙数”思维,地球所有沙滩的沙子共计700.5万亿亿粒,要把2020年的所有数据刻在沙粒上,每粒沙子上将布满500个比特。


从人类已经制造出的1022比特,到宇宙能够承载的1090比特,这中间的空间看起来还很大。但是,信息仅仅存储还不够,必须处理才有意义,而处理每个比特都需要消耗更多物质和能量,因此,我们在宇宙中能够存储的信息量远远小于1090比特。宇宙自创生以来已经发生了10120次量级的操作,其中源于人类的操作所占比例微不足道。宇宙再经过同样量级的操作后就将消散,在这10120次操作中,人类能够找到那把改变黑暗宿命的钥匙吗?


回答这个问题,必须挣脱物理的束缚,跃升到信息层次,从形式一元论的视角去寻找那把钥匙。


回到以2为底的对数曲线(见图1):



点(2, 1)对应经典比特,即一个单位信息。


点(1/2, -1)对应量子比特,蕴含一个单位的信息量,物理上对应本征态概率相同的两状态量子系统。


点(1/4, -2)对应两个量子比特,蕴含两个单位的信息量,物理上对应本征态概率相同的四状态量子系统。


点(0, -∞),蕴含无穷大的信息量,对应涨落的真空。“无,名天地之始。”是为“无极”。


点(1, 0),零信息量。之上的“正信息量”对应确定的宏观世界;之下是“负信息量”,是蕴藏丰富信息的量子世界。“有,名万物之母。”是为“太极”。


无极到太极,是多态叠加的量子世界……


太极到两仪、四象、八卦,是我们熟悉的大千世界……


我们熟悉的物理的大千世界,包含1080个原子,1090比特的信息容量。然而,这只是物理系统的容量,远不是形式系统的全部。按照形式一元论的观点,物质有限,能量守恒,而形态变化万千。任何存在都具备某种形式,任何形式也都可能存在。


在所有存在形式中,人类可触及的形式空间又可分为如下子域:自然物理存在、人工物理存在、人类可体验存在、数学存在、超验存在。人类可体验存在是人类大脑能够感知到的最大形式空间。数学存在是人类可能掌握的数学所能表达的形式空间。所有这些空间之外,人类确知存在但又无法体验的形式空间姑且称为超验存在,例如量子世界,爱因斯坦能在大脑中构造出相对论场景,却至死也“想不通”量子世界。未来我们是否可以突破量子魔障,理解量子世界,还是未知数。


如果那把钥匙还在上述形式空间之外,仅凭我们的大脑是找不到的。唯一的解决办法就是回到物理世界,以自己的大脑为蓝本,制造出更为复杂的电子大脑,让复杂性和信息处理能力都远超经典计算机以及我们自身大脑的电脑去探索更为广阔的形式存在,或者它们再设计出超越其自身的更强的电脑,去寻找那把破解宇宙黑暗宿命的钥匙。


这正是:


谁云万事空,宇宙终随风?

涨落能量体,弦动万物生。

形式一元论,信息贯始终,

电脑接人脑,冥冥蹊径通。


作者介绍




黄铁军


•CCF杰出会员。

•北京大学教授,计算机科学技术系主任、数字媒体研究所所长。

•主要研究方向为视觉信息处理和类脑计算。

脚注


1  麦克斯韦妖(Maxwell's demon),是在物理学中假想的妖,能探测并控制单个分子的运动,于1871年由英国物理学家詹姆斯·麦克斯韦为了说明违反热力学第二定律的可能性而设想的。


2 卡拉比-丘成桐空间简称“卡-丘”空间,是指一个卷缩的高维空间。这理论是科学家猜测出来的,它有6个维度,没办法用仪器进行观测。


3 美国作家布赖恩·格林所著。他是当今世界领先的弦理论家之一,在书中他十分精妙地把科学思想与写作融合起来。本书撩开了弦理论的神秘面纱,揭示了一个11维的宇宙。在他的描述里,空间的纤维撕裂了又自己缝合起来,一切物质——从最小的夸克到最巨大的超新星——都在微观的小能量环的振动中产生。


中国计算机学会

微信号:ccfvoice           

长按识别二维码关注我们


CCF推荐

【精品文



点击“阅读原文”,加入CCF



您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存