前言在学习数学的过程中,想必大家遇到过各种各样的迷茫与困惑。为此,小π工作室开设了“师言数语”栏目。在此栏目中,我们将对数学系、概率统计系、信息与计算科学系和金融数学系的老师们进行访谈,听他们讲述自己的学术故事和科研感悟。相信本栏目能帮助大家了解、选择自己的专业和方向,增进对数学知识和科研问题的理解。为了帮助大家更多地了解计算生物这一交叉学科,本期我们的采访嘉宾是李铁军老师。李老师向我们详细讲述了他多年来的科研心得和体会,也提出了很多实用而中肯的建议。李老师的采访稿很长,我们将其分成了三篇。本篇主要讲述了数学的工具、生物对数学研究的反作用。数学的工具当我听说你们要采访我之后,我自己想了一下,我觉得有一些事情是我想要传达给数学学院的本科生的。其实主要就是数学工具的事情。我们如果要去做生物,做生命科学中的数学,要用数学的方法去发展生命科学中的一些东西,我们到底应该掌握什么样的基本工具?随机的工具我想第一个重要的就是随机的工具。随机这个工具非常之重要,为什么我要强调这一点?因为通常我们做计算数学的人,其实在这一点上基本上是忽略了。以前的东西都是确定性的,比如说所有的数值分析或传统的偏微分方程数值解,都是针对确定性的东西来做。但如果想做生物的里面的一些应用,你不掌握随机的语言是不可能的。为什么?因为生物的体系,它的尺度比较小,用物理学的语言叫做“介观”。在介观尺度下,所有你所观察的体系,它的“涨落”效应不可忽略,这是统计物理的一个基本认识:涨落不可忽略的时候,噪声就一定是一个非常重要的方面。如果你完全用确定性的语言去描述,这样写出来的东西跟实际的体系的观察一定是差的太远。描述介观尺度就必须要用到随机的东西。这一点在大家做细胞生物学时非常重要,而细胞生物学现在是用数学研究生命科学里面大概是最主要的方向之一。但是也有一些做生物数学的人,他们是不用随机的工具的,比如说研究人口动力学、传染病,但这些都是相对传统的模式,就是ODE或PDE的内容。物理学的不同尺度统计的工具第二就是最好还是要掌握最基本的统计方法。其实要求不过分。为什么呢?我在当学生的时候,对随机的语言我只就学过一门初等概率论的课,跟你们一样,学的就是最基本的这些。随机变量这些东西我是知道,但是一些统计的方法,更深刻的如随机微分方程,我是完全不懂。在本科的时候,甚至读研究生,读到博士我也是完全不懂。那时曾有个朋友问我,他说我现在做生物,里面有一些数据,你不是做计算的吗?你能不能帮我算一算?我说这东西我完全不懂。那时候我还觉得我挺自豪的,为啥?因为我想正好有个理由把你这个事情推脱掉。我现在做的这些传统的东西不挺好的吗?我干嘛去做那个东西?人有的时候就是喜欢把自己封闭起来,就取得了一种安全感。如果人完全开放就感觉没有安全感。但这其实是有问题的,有的时候你必须要让自己变得开放,必须要接受一些外来的东西,接受外面的一些冲击,这样才能让你有更好的活力。生物中的数学工具我是在博士毕业之后,甚至是在读博士的时候,跟鄂维南教授有很多的接触。因为张平文老师那时候和鄂维南老师合作做一些问题,我是张老师的学生,自然的就加入到队伍里面来。鄂老师做随机分析是专家。但我想他读本科、硕士、博士的时候,肯定也没怎么接触过随机分析。只是后来他在库朗所做博士后的时候,抓住这个机会,把随机的课程全部旁听、提高了一把。鄂老师是一个非常有远见的数学家和科学家,他意识到随机的东西将来会成为一个非常重要的研究方向。因为传统的应用数学研究大家都是做确定性的东西,那些还没有怎么被开垦的东西一定是重要的。鄂老师在对研究方向的感觉这个方面是极其敏锐的,事实上我认为在这一点上鄂维南老师是我所见到的所有科学家里面最出色的。在随机的问题上他是专家,然后我去跟他学习,慢慢我就意识到随机的方法非常重要,我想我跟鄂老师在这点上有共鸣。但处理数据就是要用统计的方法。因为统计学天然的就是有一堆数据,我怎么去处理。而数据是极其重要的,现在生物里面你做实验,测出来数据;计算机领域也是不断产生出数据。所有的科学都不断地产生数据,而且做研究的第一步一定是要先接触数据,你不可能是第一步就出来一个模型。但以前为什么我们接触的都是模型?这是因为经典的物理经过了开普勒,经过了牛顿,经过了好多物理学家发展之后,把很多物理的规律全部摸清楚了,一些基本的物理定律被建立起来了。所以我们接触的都是模型,这就变成一种范式。但是现在生物这个领域,在计算机或者说数据这样一个背景下,你要回到没有“牛顿”时科学家所面对的一个环境。在生物里面没有“牛顿力学”这样的原理出现,甚至像“开普勒”那样的水准,也还没有达到,只是测量了很多的数据。这些数据背后所蕴含的基本的数学原理是什么?不知道。大量的人都在做收集数据的工作,生物学家所做的实验就在不断的产生数据。开普勒(Johannes