查看原文
其他

吴军:数学,为人生之题解出漂亮的答案



算法数学俱乐部

日期2020年01月06日

正文共:4828字1

预计阅读时间:13分钟

来源:中读APP


访谈嘉宾



吴军


毕业于清华大学和美国约翰·霍普金斯大学,作为资源研究员和副总裁分别任职于Google和腾讯。现任丰元资本创始合伙人、上海交通大学客座教授、约翰·霍普金斯大学工学院董事等职。 著有《数学之美》《浪潮之巅》《大学之路》《文明之光》《硅谷之谜》和《智能时代》等多部畅销书,并多次获得国家级图书大奖。






如果用当下比较流行的说法来概括吴军的身份,他便是会摄影、会写作的计算机科学家中最爱发微博的投资人——几乎很难用一句话涵盖“吴军博士”(吴军的微博昵称)会做什么、想做什么、在做什么。更不用提他履历上诸多煊赫的标签,譬如“清华”、“约翰·霍普金斯”、“谷歌”、“腾讯”、“硅谷风投”以及“文津图书奖”……其实跨界本身并不稀奇;但是像吴军一样跨界并在每一界中都取得成功,才会引来众人的注意力与好奇心。


不过拥有多重炫目身份的吴博士却常常公开表示:成功“跨界”的要义并不在于多与快,而是在于精,在于经过观察与思考后看到每个行业的本质。至于本质如何抵达,则需要工作中果断抛开细枝末节的魄力、在新行业中迅速搭建知识架构的能力。


诚然,吴博士对新技术与新趋势的敏锐一定不仅仅来源于他的老本行:计算机科学。但是专业学习与钻研对他行动和思考的影响,一定是毋庸置疑的。当然,数学对他的教益更不能不提。在著作《数学之美》中,吴军曾对数学的魅力和实用性大加赞美。于他而言,数学不但是“解决信息检索和自然语言处理的最好工具”,还能“非常清晰地描述这些领域的实际问题并且给出漂亮的解决办法”。


或许没有谁会否认,在我们如今所处的信息时代,懂数学、懂计算机科学几乎是行走于时代前沿必备的核心技能。“算法”与“逻辑”不但是时代先行者们看待世界所用的滤镜,更是创新能力的源泉。


借用吴军自己的话来讲:“你最终能走多远,取决于见识。”至于见识到底怎样获得,对数学的理解、对计算机科学的掌握究竟如何指导见识的积累,就只有吴博士本人才能一一道来了。





Q:您是如何理解数学的?在工作与事业中,对数学的理解与掌握扮演了怎样的角色?




数学首先是各种科学的基础,不仅仅是自然科学的基础,包含有些社会学科像历史,它的研究方法其实和数学有一定的相似性,因为它都要非常讲究逻辑,讲究推理,历史并不是一个简单的对和错,一个事实和谬误的这么一个事情,它和数学的几何其实有很大的相关性。像美国的著名的总统林肯,在去国会讲人人需要平等的时候,他是拿了一本几何原本,因为既然几何原本中讲天下有一个不证自明的公理,所有的直角都是相等的,那么为什么不能人和人都是相等的,等等吧,所以数学它是一个基础,它跟很多学科相关,它在工作中的作用,这个我要把它分为两种,一种是对专门的科学家包括数学家,也包括自然科学家,历史学家等等,对他们来讲,其实科学很大程度上是学习物理、化学、生物等等,或者今天搞计算机搞统计,它们的一个基础,也可以说是一个工具。因为今天比如举例子说,人工智能从本质上来讲,就是数学模型。

 

但是对大部分人来讲,其实,生活中用不着这么多数学,虽然我们过去说做一些加减乘除运算,算算账,今天你有了计算器、有了手机,连这个功能其实都不是很重要了。那么为什么大家还需要学数学?


我想,从三个方面来谈一下。


数学其实讲究的是一个逻辑,它跟实验科学不一样,实验科学都是你观察到一个现象,然后试图通过一种理论解释一个现象,数学它不是,它是从一些符合我们日常认知的基本假设出发,然后完全用逻辑推导出的结论,只要它的逻辑是对的,它的结论都是对的。因此它是练习一个逻辑推理,尤其是像几何学,主要目的是这个。其实我们今天你除了买房子量一下家里的面积用一下几何,剩下的时候你可能用不到几何,但为什么需要学?实际上是头脑的这样一个训练。


阅读理解的能力,表达的能力。怎么理解这件事儿呢?因为据我观察,孩子们如果不会做数学题,坦率来讲,发现一半情况是题根本没读懂,就是他理解不了,很多人读不懂数学书,那它当然也有可能是数学书写的不好,这也是表达能力的一个欠缺。数学能学好的人,常常你会发现他是讲问题讲的比较清楚,比较透彻,因为他能够从他自己想表达的意思出发,然后找到证据,然后得到结论。所以数学的训练是一个沟通的训练,表达的训练。


数学的发展过程中,它是对现实事物的一个抽象化。你把一些东西抽象出来一些概念,一些符号,一些公式,一些定理,那么这个实际上是对我们的现实生活的一个理论的提升。我们说为什么有的人能成为大科学家,他的本事是在于他能够把我们看到的很多共性给挑出来。这是数学的一个很漂亮的地方,它的美感也在这。你比如说,我们把所有的未知数用一个简单的X代替,那么以后大家就有一个共同的交流的平台,知道你一提X的时候就是未知。这是一个人对抽象表述的本事,也可以认为是一个抽象思维的训练。我觉得对普通人来讲,数学至少有这样三个作用,逻辑的培养,表达能力的培养,以及抽象思维能力的培养。所谓创造,就是说要做出前人所不知道的一些新的发明,新的方法,以及有时候需要抽象出一些概念,或者对以前人们所知的知识进行总结。这是创造力。创造力可以有大有小,有理论上的有实际上的,没有一个很严格的限制说哪些就不是创造,哪些是。你比如说,你设计出一种新的图案,那可能也是一种创造力。


    科学理论的创造力,最重要有两条:

它是基于前人工作的基础。科学和技术是世界上几乎仅有的能够取得叠加式进步的人类知识体系。其他的东西,比如像音乐、艺术,你很难说今天的人,你即使看了过去很多大师的作品,说能超越以前的大师。今天没有人敢说自己的音乐写的比贝多芬或者莫扎特好,或者绘画超过了米开朗基罗,或者是像拉斐尔这样的人。但是今天任何一个人你上完微积分以后,说我数学水平跟牛顿一样高,今天一个三甲医院的大夫都可以说我的医术比50年前世界上最好的名医要高。这是一个叠加结果。所以创造力,首先在于说他对前人知识的完整了解。我们经常有些人说,脱离了以前人做的工作,自己拍着脑袋在这创新,实际上他们思考的一些问题,前人早就思考过了,而且证明是不管用的。那么理论上的创造力更是如此,所以他实际上是以前工作,如果是实验科学比如物理和化学,以前人们观测到现象,解释的这些现象的理论,对它们的一个完善。所以没有以前的理论,你是很难创造出新的。对数学来讲,是以前结论的定理、定律的一个自然的逻辑推演的结果。


理论上的创造力,关键在于,它很多时候是很长时间量的积累,然后才突然你会发现有一个质的进步。它不会永远有质的飞越,也不会是一个匀速的过程。所以很多时候你会发现说,沉寂了很多年,然后一下子有一个大爆发。比如在古希腊的时候,我们基本今天谈的科学的一个原型在那产生,包括基于逻辑推理的几何学,也包括实验科学,比如说当时亚里士多德他们开始了博物学,有点像我们今天生物、物理、化学。那么这是一个大爆发时间,然后后来就经过了差不多将近1千年的停滞,伽利略他们后来又有一些新的洞见。到了牛顿时代,突然会有一年,就是牛顿回家躲避瘟疫这一年。今天我们看到物理学,整个经典物理学基础的那些理论,突然都被奠定出来了。这其实是一个很长时间量的积累,到这时候,万事俱备,一下发现好像创造力非凡。这是一个。再一个当时牛顿那时候,虽然他是理论学者最杰出的代表,但是当时其他一些人像哈雷、胡克、波伊尔这些人其实他们是在一起的,实际上是一个大的团体。到了1905年,爱因斯坦,所谓他的爆发年。我们今天讲狭义相对论,讲质能转换、分子论等等,好像那一年爱因斯坦发表的很多东西,如果一定要给他诺贝尔奖,能给他很多。那么近几年来,世界上这种大的理论,是处于一个相对停滞的一个状态,但是它也在发展,所以这个理论的发展,不能完全按照我们今天技术的发展,觉得每个时代都有每个时代的产物,它是有一个间歇性。


    实用中的创造,有这样几个特点:

它的时效性特别明显。理论上工作它有一个叠加的效应,实际工作常常这一代技术过去以后,对后面的影响不是那么大。比如说我们发明了一些磁存储的技术,当然这个做了几十年,最后磁带越做密度越高,磁盘的容量越来越大,但是后来今天我们知道用光盘来代替了磁带,然后用半导体的存储代替了磁盘。那么以前那些技术和后来其实没有太大关系的。但是这是在人类发展过程中的一个知识的积累,也是有意义的,但是它对后面的影响会比较小。不像理论,今天牛顿理论对以后的影响,过去牛顿的理论对今天照样有影响。


技术的创造它不但要谈到好和不好,还要考虑贵和不贵,在日常工作中用的创造,那是要考虑成本的。


在同一个时代,会同时出现很多类似的技术,比如戴姆勒和本茨同时发明了汽车,实际上没有张三会有李四、王五来做同样的工作。只是有些时候,某一个人他在商业上更成功一些,所以他的成绩被别人看到了。


应用的创造,它有时候不能等米下锅,现在这个需求来了,就要解决问题,就得很快的利用现有的技术,现有的理论到什么程度了,那你就得用,解决不了的,可能就要暂时存疑,放在一边。你不能说我再研究20年,再给你个结果,这是不行的。世界上很多事儿,没有最好,只有更好。很多进步是叠加的。他没有绝对的对和错。我在读博士生的时候,我发明了一种算法,大概把原来机器学习的效率提高了上百倍,使得计算机无法完成的计算现在能完成了。虽然这是一个计算机算法,那我研究和推导这个算法时候基本上大概有几个月时间,工作的工具就是一打纸、一根笔,大概就是这样,来回推导。这里也可以看到数学和计算机的一个关联。我在谷歌最后两年,负责设计计算机自动回答问题,这样的一个算法,这个研究的课题其实由来已久,而且学术界已经做了几十年了,但是都解决得不好。这是一个比较实际的创新。我们是比较成功的把它从一个人工智能的问题转换成了一个大数据的问题。谷歌有相当多的数据,而且数据非常完善,通常大家问的很多问题这些谷歌的数据里面是能够找到答案的,这是学术界没有的优势。并不是说真是研究这个问答,分析里面的逻辑,而实际上是通过信息的搜索以及语言的处理,通过数据的处理,通过数学模型,来解决智能的问题。从这里面能看出,刚才我讲的另外一条,很多时候你不能等米下锅,在当前的条件下,我们要解决一个问题,我们看看我们自己有什么条件,然后利用我们现有的条件,能把问题比较好的解决掉。


Q:您怎样评价当今的高等数学教育?在对专业计算机人才的教育与培训中,您觉得我们现阶段面临着什么挑战?




今天,高等数学教育基本上,大家进大学以后学的难度是一样的,即使你同样是好的学校,清华或者北大,人的数学水平还是有差别的,应该在选课上把这个差别体现出来。数学和计算机被认为关系比较紧密,但我个人认为,其实数学相对和电子工程关系、跟通讯的关系可能更紧密一点,今天中国计算机教学,我觉得最大的问题,实际上坦率来讲,实际上是作业量不够,大部分老师计算机课程,留的作业好多是笔头的,即使是上机的作业,都是很小的程序要编,最后在考核的时候,考试上的成绩还是很多的,动手上成绩比较少,真正的像美国好的大学,甚至很多计算机课程,是完全没有考试的,那就是做project来看成绩。因为计算机是这样,你做的出来就是做的出来,做不出来理论考试考得再好也是没用的。所以我觉得这个要改。但这个修改的问题就在于,助教的力量得跟得上来,得有很多人投入很多力量,来辅导学生的实验,来改学生的project。


Q:有什么关于数学/逻辑/思考的经典书籍比较适合大众阅读?



一本比较简单易懂的数学书,叫《从一到无穷大》,这是美国著名的物理学家伽莫夫写的,他是核聚变的提出者以及宇宙大爆炸提出者,虽然他没有得诺贝尔奖,但是他的水平是非常高的,后来出名了,反而是因为写了这几本科普书。了解物理学和天文学,霍金的《时间简史》也不错,另外还有一个了解现代科学的科普书,叫《给世界的答案》,作者是诺贝尔奖获得者斯蒂芬·温伯格。



— THE END —


机器学习萌新必学的Top10算法
第一批 90 后还有半个月就 30 岁了!那些 30 岁前就成博导的人都怎样了...如何黑掉一台根本不联网的电脑斯坦福大学教育学院院长:学习本身就是一门学问为什么计算神经科学和AI会融合知乎热搜可以被人为控制吗?如果可以,怎么操作

    您可能也对以下帖子感兴趣

    文章有问题?点此查看未经处理的缓存