差不多60年前,在那篇具有里程碑意义的文章《数据分析的未来》中,约翰·图基(John Tukey)提出一个预言,一个突破数理统计学边界的数据时代正在到来。在此基础上,他又提出一个崭新的概念——数据分析,并认为数据分析的目的是通过对数据的收集、处理和分析来学习其中的信息,最终解决生活中的实际问题。那之后,随着计算机技术的进步和互联网的普及,各种数据的指数式增长让越来越多的人认识到传统统计学无法涵盖这个复杂的新生事物后,一个和现实联系极为紧密、又拥有独立思想和方法的学科——数据科学开启了蓬勃的发展。时至今日,数据科学已经形成自己独特的概念框架。它强调理论的突破,也注重工具的开发,R语言和Python的诞生因此都具有极其重要的意义;它强调计算的价值,也注重模型的建立,正是数据科学的发展让更多人认识到算法建模的思路更有助于解决重要的现实问题;它强调学科发展的独特路径,也注重跨学科研究的无限潜力,对高维问题的探索就代表着数据科学最新的成就。与此相对,数据科学也面临着自己独特的学科挑战。它看到计算技术的进步和人工智能理想之间的紧密关系,因此既强调要突破硬件的瓶颈以便利数据的流通,也强调思考软件的革新以优化数据的使用;它看到本学科的独特定位和成果所具有的独特工具属性,因此既强调深入理解其他学科的问题以应对现实挑战,也强调借鉴其他学科的思想来实现理论突破。更重要的是,数据科学永远无法远离产业,它最终还是要依靠大数据、云计算和人工智能等前沿理念的不断落地,以及对其他产业的数据化思考和创造性思维来实现自身的进步。在这个过程中,数据科学的内涵和外延都在被不断定义,数据科学的经济价值和社会价值也不断显现。与那些令人激动人心的故事相伴而生,数据科学领域总在诞生很多极具特色的研究机构,她们有的扎根大学,有的立足产业,有的强调理论探索,有的注重软硬融合。达摩院就是其中之一。她的使命甚至在正式诞生前就已经存在:2014年,她的前身——数据科学与技术研究院(iDST)在硅谷宣告成立,那是中国科技企业以成建制方式组织科技攻关的重要时刻;那之后三年,带着阿里巴巴的技术积淀与社会担当,达摩院宣告成立。达摩院当然有她独特的使命,她需要去思考和解决那些她认为这个时代最重要的技术问题,如存算一体、RISC-V指令集等新型计算范式,又如医疗AI、智慧育种等创新应用场景,再从这个起点开始尝试改变世界。更重要的是,这些独特中蕴含着共同的理想。展望未来,无论定位如何迥异,达摩院和她的同行者始终为之奋斗的都是共同的目标——寻找数据之钥,开启未来可能。
创新无止境,同路皆知己。仅以此片,与科技同仁互勉。
今天是第八个全国科技工作者日,祝全体科技工作者节日快乐!