【言十系列】新工科与大数据
135编辑器
上期刊发了《新工科建设与系统能力培养》,针对新工科建设中数量最多、影响最大的计算机类专业中的系统能力培养进行探讨,引起很大反响,受到读者的广泛欢迎。本期继续以新工科建设为背景,探讨“新”的涵义,分析“新”时代的特征、面临的“新”问题及解决方法。
0 引 言
所谓工科,是指应用科学原理、结合生产实践所积累的技术经验而发展起来的学科[1]。主要特征有三:一是依据一定的科学技术原理;二是造出人工物(机器);三是解决实际问题。
现在我们谈论新工科,就得在新字上下工夫,这个“新”的含义是什么? 通常而言,任何影响工科要素的改变都可能带来新的变化,也就是说任何基础科学原理的重大突破、人工物载体的变化或者需要解决问题的变化都可能带来新的巨变。
2017年2月以来,教育部积极推进新工科建设,先后形成了“复旦共识”“天大行动”和“北京指南”[2-3],并发布了《教育部高等教育司关于开展新工科研究与实践的通知》《教育部办公厅关于推荐新工科研究与实践项目的通知》,形成了影响全国的新工科建设运动。这里面,既有中国教育界不甘人后、积极探索工程教育的中国模式和中国经验,助力高等教育强国建设乃至领跑全球工程教育的冲动,又有教育界主动应对新一轮科技革命与产业变革、支撑服务创新驱动发展和“中国制造2025”等一系列国家战略实施的真实愿望。新工科并不一定缘于科学原理方面的重大突破而产生。
根据这一判断,新工科的“新”主要体现在:我们面临的问题是新的,需要制造的工具是新的,归根结底是由于时代的变化引起的。为此,我们有必要分析一下这个时代的新特征、面临的新问题以及解决问题的新方法是什么,而通过分析这些新特征、新问题和新方法可以发现,每一件与社会息息相关的事情都离不开大数据。
1 新时代:数字社会和数字经济
虽然现代计算机发明到今天才70多年,但是计算机技术对社会经济的影响是深远的,因为它使得信息能被表达、存储、传输、处理,这使得信息如同物理世界的物体一样,成为一个感受得到的真实存在。基于计算机技术的信息通讯技术以及互联网技术的发展和应用,我们所处的时代正迅速进入信息时代。就全球拥有的信息总量来看,我们已经进入ZB级阶段,而且存储的信息总量还在以指数级的速度增长。以BAT公司为例,他们所拥有的数据总量都在1 000 PB以上。党的十九大明确提出“数字中国”的概念,国务院积极推行“互联网+”行动纲要、大数据行动纲要等,无不指向这样一个事实,那就是互联网和大数据技术已经给我们的社会生活带来深远的影响,而且今后还会越来越大。数字经济是这个时代给予我们的历史机遇,抓住了这个机遇,中华民族的伟大复兴之梦就会成为现实。
为什么数字社会这么重要呢?关键就在于数据是这个时代的新动能(power)!我们都知道电是工业社会的动能,几乎一切的机械设备都需要电提供能源和动力;同样,数据是新时代数字经济的新动能,新的机械设备需要数据来驱动。这种乍听起来天方夜谭的事情,其实背后有着深刻的合理逻辑。
举个例子,最近马云在一个活动中讲到,服务业是制造业,制造业也是服务业。他的逻辑如下:服务业(如餐饮)除了最后一道工序体现的是服务之外,其他所有环节,包括原材料进货、食品加工和配送等都是典型的制造业;同样,现代制造业如果不考虑服务的因素,就不具有竞争力,例如,服装生产是典型的制造业,现在已经可以量身定制,可以根据客户的个性化需求进行生产制造,这难道不是服务业吗?这种制造业和服务业的融合,前提就是因为有互联网的支撑和大数据的驱动。新工科是为这个时代服务的,这个时代的“机器”一定是数据驱动的。
还有一个理解数字经济中数据重要性的角度是“数字孪生”的概念。所谓数字孪生,是指一个物理世界的对象(机器)在数字空间中可以有一个数字孪生体存在,通过各种传感器,可以实时地捕获物理世界对象的状态并在数据空间中反映出来;同样,数字孪生的任何改变,都可以通过控制器等影响物理世界对象的行为。这种虚实结合融为一体的状况将是未来数字社会的一种普遍现象,数据在其中扮演越来越重要的角色。
2 新问题:大数据的采集、存储、分析、利用和治理
数字社会与数字经济带来的新问题是什么?核心就是大数据的采集、存储、分析、利用、治理等全生命周期中的问题。这些问题既有作为信息技术的共通问题,又有领域特殊问题,特别是如何利用的问题,关乎领域的核心价值。如果从工程学科的角度看,新问题就是如何构建和利用数字孪生体的问题。
以风电制造业为例,如果只考虑风力发电机的制造生产,这就是传统的制造业,但是我们都知道风电很难利用,属于“垃圾能源”,需要的时候没风,电发不出来,风大的时候又可能不需要用电。因此,如果不能很好地解决风电需求预测与风力预测的问题,风电产业难以发展壮大。现在有了大数据,这个问题就可以迎刃而解。如果我们不仅仅制造出风机,还造出风机的数字孪生体,不仅仅拥有单一的风机产品,还包括风机的运行状况,并与电力使用情况和天气预报系统进行连接,那么通过对电力需求数据和天气情况的预测,就可以科学安排风机的运行;同时,通过对数字孪生体的数据(风机运行情况)分析,可以预防和排除可能的故障,减少运营中的不确定性风险。可以说,大数据已经成为风机生产制造和运维中不可或缺的重要组成部分。在专业教育中,相关的专业人才培养尤其需要面对这些产业中的新问题,并学会如何解决这些新问题。
3 新方法:数据驱动的解决问题方法
数据科学(data science)被认为是继实验观察、理论推导、计算机模拟后的第四科学研究范式,已经对天文学、生命科学等领域的科学研究产生了重要的影响,如基因测序所形成的基因大数据,将生命科学的研究从实验科学带进数据科学。不仅如此,对于社会科学而言,用数学的方法难以精确建立模型,取而代之,大数据是社会系统非常自然的模型。马克思说人是一切社会关系的总和,而社会关系就是人通过“劳动”与外界交互而形成的。如果有能力记录人的全部交互行为,在很大程度上就可以描述人和社会,网络科学的研究进展也充分地说明了这一点。Science上曾刊登过一个研究成果[4],利用从文献中获得的欧洲历史上名人的出生地和死亡地的数据,得出了“条条道路通罗马”的结论,也就是很多名人出生地没有什么规律,但是死亡地都是在罗马。无疑,罗马就是历史上欧洲的中心。这是大数据在历史学研究中的一个具体例子。因此,数据科学是新的研究范式。
不仅如此,数据科学也是新的工作方式。当遇到复杂问题的时候,可以求助于大数据。大数据是历史经验的积累,通过历史经验,我们可以挖掘规律、学习模型、预测监测、决策判断,甚至将人纳入整个系统中,成为人机物融合系统的一部分,这是传统自动化机器系统所不具备的。举个例子,旅行路线规划问题是典型的图论中的最短路径问题,但是,当图的规模变得越来越大时,传统的数学算法就不灵了。如果记录了日常旅行的路径,这是人的智慧的积累,这个时候只要做些简单的统计,找到适当的分类,就可以提供可行的旅行路径规划建议……这就是大数据方法,与传统的研究方法不一样。新时代的人才不仅仅要掌握传统的科学研究范式,还需要掌握新的基于大数据的研究范式。
4 新能力:掌握大数据方法是新工科学生必须具备的一种能力
如果掌握大数据方法是未来新工科人才需要具备的基本素质,那么怎样才能培养这种素质呢?这是一个大问题,需要所有的教育工作者认真研究和实践才能给出好的答案。我们姑且在这里提出一个初步而笼统的框架。
首先,需要一门数据科学的基础课程,利用一种工具(如python)的学习和训练,让学生了解数据科学的基本概念,熟悉数据处理的过程,特别是数据分析的基本技术手段,养成解决问题需要求助大数据的习惯(当然并不是所有问题都需要大数据,对于那些模型难以建立和传统的科学方法还无能为力的复杂问题才适用大数据方法)。
其次,需要一门数据科学的高级应用课程,结合专业的特点,设计一门物理系统与数字系统融合的新课程,体现数据驱动的方法在其中的作用。通过学习,学生可以培养运用大数据解决工程领域复杂问题的新能力。
最后,要营造“产教结合、协同育人”的大数据实习实训环境,结合大数据领域或大数据行业的典型应用问题,开展问题导向的案例式、启发式、互动式及探究式教学,培养学生解决大数据领域或大数据行业实际问题的思维能力和动手能力。
5 结 语
新工科建设要面向数字社会发展的需求,为数字社会培养人才。数据是数字社会的新动能,要充分认识大数据在新工科建设中的作用,自觉运用大数据的能力是新时代人才培养的核心目标之一。
参考文献:
[1] 百度百科. 工科[EB/OL]. [2018-06-25]. https://baike.baidu.com/item/%E5%B7%A5%E7%A7%91/9824985?fr=aladdin.
[2] 教育部高等教育司. 教育部高等教育司关于开展新工科研究与实践的通知[S]. 教高司函[2017]6号.
[3] 吴爱华, 侯永峰, 杨秋波, 等. 加快发展和建设新工科 主动适应和引领新经济[J]. 高等工程教育研究, 2017(1): 1-9.
[4] Schich M, Song C, Ahn Y Y, et al. A network framework of cultural history[J]. Science, 2014, 345(6196): 558–562.
(完)
更多精彩:
以赛促教,以赛促学,创新人才能力培养——中国大学生计算机设计大赛参赛有感
立意正、内容顺、质量精、心理硬 ——中国大学生计算机设计大赛参赛有感
2015年中国大学生计算机设计大赛软件开发与设计类决赛获奖情况分析