CTO教育思想库 | 吴新野:大数据在城市治理中的实践
编者按
华东师大上海国际首席技术官学院CTO教育思想库系列,汇集学院教授、导师和特邀嘉宾的演讲、讲课或发表的文章,以原创思想成果与广大学员和社会公众分享。这些知识和思想成果多方位、跨领域,体现学院确立的人才培养理念,即将科技与管理结合、技术与商业化整合、“科学家精神”与“企业家精神”融合。
今天我们编发上海德拓信息技术股份有限公司总裁、上海国际首席技术官学院特聘实践教授、数据智能专家吴新野的公开课核心内容。吴总于2022年6月29日在我院“MEM第六堂公开课暨招生说明会”上,以“大数据在城市治理中的实践”为题授课。以下为授课内容精编。
全文4433字 | 阅读约需14分钟
今天,我想与大家分享的主题是“大数据在城市治理中的实践”。选择这个主题的原因是,我认为这与每个人都有一定的关系,那么我分三个部分来展开分享。第一是数据智能产业的整体布局和发展历程;第二是结合一些案例来感受企业发展中的探索精神,包括其中我的心路历程和总结出的方法论;第三个是根据十年来整个世界在这个领域上的进步和提升。
01
数据智能产业的整体布局和发展历程
首先来看数据智能产业的整体布局和发展历程。最早在2014年3月,大数据首次被写进了政府工作报告,所以业界就把这个年份叫做大数据政策的元年,并逐渐开始成为了热点。从国家层面上来讲,开始了这个产业的发展,同时国务院也印发了相应的行动纲要,进入了大数据产业的发展起步阶段。那个时候在全国各行各业落地的大数据应用其实还很少,一直到2016年3月,大数据被正式写进了“十三五”规划里,我们把这个时期叫做落地阶段。自此全国很多行业,尤其是政府,逐渐开始了大数据的一些实践。真正的繁荣其实是从2017年10月开始的,一直到今天为止都是深化阶段,这个阶段的特征是中国要从数据大国迈向数据强国。中国天生是一个数据大国,2020年4月,国家正式把数据列为新型生产要素,把数据要素的市场化配置提升为国家战略,这项举措具有重大意义,数据也成为了生产要素。
我们可以看到前几十年中国经济的快速增长和发展繁荣其实得益于几个生产要素。最重要的是劳动力,这也是因为中国的劳动力比较丰富,之后中国就变成了一个制造业的大国,之后城市化的进程也推动了土地、房地产作为生产要素的发展。很多人说企业或者企业家们其实只要牢牢抓住了这三个生产要素中间的一个可能就够了。
02
数据作为生产要素的发展意义
今天,技术和数据这两个要素已经成为推动社会变革和发展的重要要素了,今天中国在研发上的投入已经占到全球第二了。业界把这两个要素叫作高级要素,那么高级要素和低级要素之间是什么关系呢?我们以劳动力为例,劳动力的人口红利其实是逐渐在衰退的,但如果把技术和数据赋能给了劳动力这个生产要素,其实就是劳动力、技术和数据的结合,又能使得劳动力欣欣向荣。再从土地城市化的角度看,现在加强了技术和数据对城市化的赋能,提出了新型智慧城市的概念,我后面也会仔细介绍这个概念。
我们会发现,其实一切都能够转化为数据。比如说原来我们做信息化,20年前大家在做信息化的工作包括各种感知设备、物联网设备,以及后来的手机移动终端,其实都产生了大量的结构化和非结构化的数据,这些都是数据资源。数据资源本身是分散的、孤立的,或者是说它的价值可能很难一下子被发挥出来。但现在到了数据化的时代,当我们把这些数据资源收集起来之后,进行一些数据的结构化处理,也就是数据工程,就有了数据资源。又有了数据治理这一步的运作之后,数据资源就可以赋能百行百业了。
在大数据这个领域中,其实数据一直是被争夺的。比如说在各个城市的大数据中心,当你成为主力供应商之后,你的工作、技术、服务得到了全面认可之后,因为你独占了资源而且年限久远,其实是很难被踢出去的。从2017年之后,各式各样的行业巨头全部入局,各种各样的创新创业公司也在不断加入,此时它的产业生态是非常复杂的,同时又叠加了客户的价值。在原来信息化的时代背景下,产品是固定的,可以产生什么价值客户是一目了然的。比如之前我们给公安做研究的时候,会发现很早以前入室盗窃一般都是破窗,后来就变成了技术性开锁。那这个时候它的价值和模型都是要重新定义的。这就是一个产业的逻辑,那么我们根据这个产业的逻辑,那么就是要去资源多的地方,才更能够发挥数据的价值。
03
数据价值的创造过程及其案例
在讲案例之前,我们先讲讲数据价值是如何创造的。我们围绕数据本身,从模式创新和效率提升这两个方向来入手。在2015年,贵州的大数据在全国是比较出名的,当时我们承接了一个项目,就是交管局希望通过大数据来抓黑车,当时我们是怎么做的呢?我们首先取得了三维的数据,第一个数据是卡口的,就每个地方路口都有摄像头,那么把这些过程数据形成一个轨迹模型。我们去看他的轨迹,如果轨迹漫无目的,或者在一些重要的机场、港口徘徊,那么这些车辆大概率就是黑车了。之后我们又结合了信访的数据,还有网上舆情的数据,把三个维度的数据进行了融合分析。那么最后发现,贵阳当时黑车数量要接近4000,但其实我们抓黑车的目的是解决整个城市交通的安全问题。所以数据价值的创造、创新是一个持续的过程。
现在我来讲数据的聚变。举个例子,现在上海市大数据中心尤其这三年来发展势头很好,其实他们从2018年开始,就把整个上海市各个部门的数据全部采集进来了,我们也有幸参与了整个建设的过程,形成了很多人口库、法人库、专题库等。那么到今天为止,它的数据量已经非常庞大了,可以结合的维度已经非常多了。以上海为例,如果要用数据描述一个人,政府有800多个维度来描述一个人,那么这个过程其实就是数据的聚变。
除此之外,更多的是临时接到的一些需求,比如说像疫情的时候,要用机器分析出复工复产的报告,这都是短期的需求。包括之前上海的部分高校本科毕业生可以直接落户上海,其实在人才政策制定之前我们是参与了很多数据分析的,通过机器的方式去计算人才的经济增加值,在很多维度上给政府提供了很多的建议,但这些都是临时性的。
在不同的需求中,有一个特别有意思的就是上海的健康码,也叫随申码,其实就是我们公司参与完成的。从2000年开始一直到现在,你会发现上海的随申码不同于别的城市,这两年来运用得越来越多:现在可以拿它去挂号、可以坐公车、可以坐地铁、也可以去打疫苗,它的内容越来越多,其实解决了城市的一些精细化管理问题,包括养老保险的一系列问题。以上这些是业务创新的裂变过程,那么在这样的环境之下,上海的新型智慧城市建设大致形成了一张架构图。最底下那层是统一的云平台和城市大数据中心,包括各种感知设备的联网,在这个方面其实各个城市大同小异,那么真正开始到中间那一层就产生了一些变化,也就是建设城市的城市大脑,主要涉及的是做决策的一些模型。刚才提到的一体化政务服务其实给市民带来便利的同时,也要给市民温暖的归属感。
我们当时注意到了政府工作报告里有一条提到提升区域的卫生服务能力,我们当时不知道具体什么叫“提升区域卫生的服务能力”,但还是采用我们2015年当时一样的方法,先通过收集各方各部门足够的信息推动聚变,然后我们寻找裂变的方式,当时突然发现一个非常有意思的现象。当我们的机器模型跑完之后,发现有很多人去北京、去上海、去广州看病,但同时大概有8000多人去乌鲁木齐看病。往下挖掘发现,去北京、上海、广州的都是去看肿瘤类的病,说明北上广这些城市的肿瘤治疗水平比较高。那么最有意思的是在8000多去乌鲁木齐看病的人中,大概有80%的人看的是同一种病——糖尿病,那么我们就牵引出了问题的来源,并且从就业的角度提出了一些解决方法。
04
数据应用顶层设计的切入逻辑与整体规划
其实当我们创新性地提出方法时,就要一定要大规划、小落地,快速试错。我们在做顶层设计的时候,应该要想得宏大一些、考虑的方法多一些,要考虑到整个架构的设计,尤其我们搞软件工程的,一开始一定要去想着力点,一定要找切入的小逻辑,然后慢慢去丰满整体的规划。如果做一个大数据的项目,干了半年发现是不对的,重新推翻重来,这个代价太大了,谁都承受不起。所以就一定要用快速输出、小落地的方式,去不断地去丰满和完善。
我再举个例子,2016年我们在北京朝阳区,当时他们说要建设智慧物业,前期也挺有意思的,就是一开始不是我们这个公司去建设的,是一家别的公司,结果花了半年时间不断地变更,找不到明确的方向和亮点。那么后来等我们介入之后,我们首先就把物业本身的数据、房管局、水电煤的数据全部结合起来,发现这家公司在高大上的CBD、写字楼里租了一层楼办公,但公司社保只交了两个人。在2019年,又有一个项目案例,我们在北京地铁做了客流量的分析,因为当时底层的AI算法已经开始成熟,我们上层再通过大数据分析就解决了不少问题。
那么接下来说的就是:数据的维度,决定数据的广度。接下来我想说的应该算是我们公司在国内的大数据落地场景中探索的第一个案例,这是非常有意思的一个案例。我们都说要把权力关进制度的笼子,在2015年当时贵州做大数据工作的时候,他们提出来要通过大数据的方式,把这个权力和制度的科学论述落地,也取了个名字叫“数据铁笼”。那么我们正好碰上他们在做试点,其实2015年的时候,国内大数据能够落地的很少或者几乎没有,大家也不知道怎么做,就把当时38个业务系统所有的数据采集过来,通过一些工具做一些小的应用,并且进行快速迭代,最后我们在两个月的时间里总共做了大概差不多有100个创新应用,那么最后保留了30个模型准备做好、做精,其中包括之前说的酒驾测试之类的应用,这些成果也得到了中央的认可。
酒驾测试涉及一系列的动作,大概涉及了七个系统,比如说执法记录仪是一个单独系统,包括吹气、数据回传,这些系统本来是孤立的,那这其中就有执法的漏洞。比如有人被拦下来了,他拼命喝水,或者吹气磨磨蹭蹭的,或者说拖时间等到第二天,到时候血液酒精指标就正常了。这种问题原来是没有办法解决的,因为它各个系统全是孤立的,那我们把这个系统打通以后,这种问题就不会有了。
执法记录仪除了对警察是一种监督以外,其实对交警也是一种保护,整个酒驾检测系统后来形成了闭环,如果时间超过系统就会报警,报警之后就会推给当时交管的纪检部门要求整改。再比如说警察在执法的时候,如果没有把地理位置信息数据接进来,他说在一条路上开罚单,那就很难知道到底是哪一段开的罚单,但是如果有GPS模块的地理位置信息,那就会发现一些地方经常有违停,猜测周围是不是公共场所聚集地,那就会去想这里的停车资源是否缺乏,于是就可以给政府做一些辅助决策。
05
总结
总的来说,大数据和人工智能想要做得好,数据质量很重要,其实传统的信息化系统,就是一个数据来源。这些数据来源质量越高,做出的数据效果越好,就促进了商业上的发展,这是一种融合;第二个特别重要,用户也特别喜欢,就是我们在永远找亮点,整个探索是一种长期的数据服务,是去解决实际问题的,而且这种服务是动态的,不断在迭代的。这些亮点非常重要,尤其是任务下达之后,时间线其实是固定的,超过了这个时间线,它的价值就会大打折扣;同时可能时间一长,项目前期的一些思路和技术都已经过时了,所以说永远找亮点是非常重要的。我今天的分享就到这里,感谢华东师大,也更感恩这个火热的数据时代,谢谢大家!
嘉宾简介
吴新野
上海德拓信息技术股份有限公司总裁,高级工程师,上海国际首席技术官学院特聘实践教授,上海市领军人才,张江国家自主创新示范区杰出创新创业人才,上海市徐汇区十五届政协委员,上海软件行业协会副会长。20多年数据智能领域的资深经验,拥有多项数据智能领域发明专利。
相关文章阅读
(上下滑动浏览)
华东师范大学工程管理硕士MEM专业学位点于2021年正式设立,由华东师大实体教学科研机构上海国际首席技术官学院负责招生和培养。学院聚焦人工智能、集成电路、生物医药和若干战略性新兴产业,培养面向未来的首席技术官和科技型战略企业家。
向上滑动
上海国际首席技术官学院
SHANGHAI INTERNATIONAL SCHOOL
OF CHIEF TECHNOLOGY OFFICER
"通过人和技术的协同转化
实现科技的社会价值"
扫码关注
获取更多资讯