到底未来城市规划大数据技术应用如何走向?答案在这里
日前,百度慧眼与宁波市规划局达成战略合作,在宁波举办了『百度慧眼宁波规划创新实验室』签约仪式,并与合作运营单位宁波市规划设计研究院举行了初步成果的研讨会。双方将充分利用百度大数据和规划行业知识,优势互补,战略协同,从城市规划领域出发,展开多层次的合作,共同探索百度慧眼大数据平台在城市研究、城市规划、城市管理、政府咨询方面的应用。
城市数据派www.udparty.com 受邀出席本次签约仪式。据了解,这也是百度慧眼与传统规划行业机构第一次深入的战略合作。城市数据派为派友们带来了详细的报道,点击查看详情:【百度慧眼宁波规划创新实验室】传统规划机构+互联网大数据平台落地!
作为宁波市规划设计研究院大数据团队和『百度慧眼宁波规划创新实验室』的核心成员,宁波市规划设计研究院杭州湾新区分院主任工程师、高级工程师、注册城市规划师,田轲给派友们带来了他对大数据环境下规划设计行业技术创新思考。
田轲(百度慧眼宁波规划创新实验室)
大数据作为一种新兴的技术手段已经越来越多的在城市规划中得以应用。我对目前城市规划行业大数据应用进展及存在问题进行了梳理,进而为未来行业大数据应用完善方向提出了设想。希望与众多关心并实践着大数据的同行们交流!
作者:田轲 百度慧眼宁波规划创新实验室
自2013年大数据概念引入国内以来,国内各行各业对其应用研究也从初识逐步成熟。
对于城市规划行业而言,过去的四年大数据应用及创新也取得了诸多成绩,但不少行业人士对目前大数据应用“技术炫耀”、“重研究轻应用”、“玩数据”等的质疑声也从未停息。
到底对于城市规划行业大数据技术应用未来如何走向?这是我们需要在总结成绩的时候需要反思的内容。
要谈城市规划中大数据技术的应用,首先还是要从什么是城市、什么是城市规划谈起。
什么是城市与城市规划?——我认为城市的复杂性、多元性及难以预测性足以与人体相比。
如果把城市比作人体的话,那么
城市规划 就是城市发展过程中的问题进行剖析进而开出治疗各种“城市病”的医疗手段,
城市规划师 就相当于是为城市这个“人”看病治疗的医生。
过去的城市规划更多的是基于感性认知的老中医!
现代城市规划学科诞生以来,无论是“田园城市”、“广亩城市”还是雅典宪章,经典的城市规划理论及研究方法基本都是基于城市使用者对城市的感性认知,这种研究方法与以“望闻问切”为主要手段的国粹“老中医”颇有几分神似。目前城市规划行业其实也意识到了这种经验科学的弊病,也在逐步提倡通过数理分析的方法重新构建城市研究方法。
在此背景下,空间句法、GIS分析及大数据分析都成为新的研究手段。这好比给老中医抽血检查、X光检查等新的检查工具,使传统老中医在现代科技的帮助下成为更加快捷有效的中西医结合!
有城市规划学者曾预言,在大数据新技术环境下“BAT这些技术与数据巨头们没有直接与规划研究和规划设计机构争夺市场,规划行业的传统领域他们毫无兴趣,但他们却在另一个维度让你的传统领地变得不值钱。”
一时间行业内狼来了的声音四起,对于未来的惶恐萦绕在每个从业人员心头。但我认为大数据是极大推进城市研究的一种新技术,没有大数据之前我们同样可以依靠经验发现问题,有了大数据技术只是让我可以更加高效、精准的发现城市问题,进而更有针对性的解决问题。
这是对城市规划的重大促进,不是颠覆!以一种更加开放的心态迎接新技术不会让我们失业,反而会让我们更加高质量的完成我们的工作。
目前城市规划行业大数据应用进展主要分为应用研究及产业化两部分。
部门统计大数据
城市规划行业大数据应用研究早期较为具有影响力的项目就是利用部门统计大数据进行研究的。例如北京市规划设计研究院BCL实验室利用北京公交卡数据研究对地铁客流量及人群特征进行分析(龙瀛)。
此类研究具有以下特点:
①从数据来源看来,部门数据获取门口较高,在不同城市难以复制。
②从数据时效性来看,数据往往存在几天至数月不等的滞后期,难以反映实时状况。③从数据定位精度来看,部门数据大多需要对位置数据实现二次转换,存在一定技术难度,且空间误差在数百名至数公里之间。
④从数据量来看,数据量大多在GB级别,对数据处理技术要求中等。
⑤从数据意义来看,基本只能反映问题的某一方面,如人口流动特征,对于人的社会数据往往难以揭示。
移动通信大数据
随着移动通信技术的提高及移动终端的普及,通过手机信令实时定位海量移动终端并分析移动终端的空间分布及活动规律成为可能。例如同济大学钮心毅老师利用上海市移动终端信令数据分析上海市人群时空分布规律进而识别空间特征及商业网点分布。
此类研究具有以下特点:
①从数据源来说,由于手机信令涉及大量个人隐私,按照目前三大运营商的“信令不出机房”的保密要求,数据获取难度较大,需要政府进行高层级协调。
②从数据时效性来看,手机信令数据实时性较强,可以及时反映城市人群的活动规律。
③从数据定位精度来看,手机信令的定位取决于基站的空间密度,不同区域的定位精度差异较大,城市核心区定位精度可在300米以内,城市郊区定位精度在1-2公里以内。
④从数据量来看,手机信令的数据量多在TB级别,对数据处理技术要求较高。
⑤从数据意义来看,信令数据仅能反映移动终端的时空分布特性,难以体现使用者的社会属性。
互联网APP大数据
随着智能手机终端及移动APP服务的普及,目前越来越多的网站、APP服务依托自身业务数据产生了大量的用户使用数据。此类数据涉及面较广,可以反映社群分布、设施分布、商业人流、房产价格等方面情况。例如利用搜房网数据研究城市房价变化,百度BDL吴海山利用百度大数据研究特定时间全国人口迁移及重点地区人群聚集预警,同时还对中国部分城市人口流失、城市收缩的鬼城现象进行研究。
此类研究具有以下特点:
①从数据源来看,由于互联网APP数据为互联网企业所有,城市规划领域大多采用编写爬虫的方式进行获取,少有研究通过合法授权获得数据。
②从数据时效性来看,得益于互联网企业强大的数据收集及业务处理能力,此类数据的实效性较强,数据滞后可以做到10分钟以内。
③从数据定位精度来看,得益于APP定位整合了GPS、Glonass、北斗等定位系统以及移动基站定位数据,APP的定位精度可以达到50米以内,且定位速度可以控制在5秒以内。
④从数据量来看,目前互联网APP数据大多已经过初步清洗及挖掘,数据量大多在GB级以下,对数据处理技术要求相对较低。
⑤从数据意义来看,互联网APP数据数据来源广泛,既有机器学习的结果也有用户上报数据,数据社会属性非常丰富,但准确度同样也存在错误数据占比较高的问题。
目前城市规划行业大数据产业化主要有平台建设、咨询服务、人才培训三方面。
大数据平台建设
目前北京市规划设计研究院与Talkingdata合作成立了XX公司,利用Talkingdata移动终端数据建设人迹平台,研究人群画像及人口的时空分布规律特征。进而为城市规划提供数据支持。
同时国内其它互联网及移动通讯公司也在建设自己的大数据服务平台:阿里集团开发了关注网络消费的数加平台;腾讯公司利用自身社交软件业务数据开发了人口时空分布的LBS位置大数据平台;中国移动开发了smartdata(司马)大数据平台。
但目前各个平台在建设过程中大多没有城市规划专业人员参与,平台数据的规范性、数据的准确性等方面仍有较大不足。
大数据咨询服务
随着大数据数据源的拓展及IT技术的提升,越来越多的公司也投身到大数据挖掘、分析市场中,尤其是在城市交通领域相关的专业咨询公司早已形成产业化规模。
例如早在2013年无锡市规划局组织无锡市城市规划编制研究中心和上海云砥信息技术有限公司公共实施了无锡居民手机出行调查,重点研究全市常住人口分布、职住平衡、居民出行客流OD等。
量子数聚(北京)科技有限公司构建数聚城市平台,用以在宏观角度分析城市产业发展、城市区域联络度等问题。
大数据人才培训
随着城市规划行业大数据应用的推进,人才缺乏问题日益凸显,在此背景下国内各类大数据研究团体、人才培训计划。例如李雯(派姐本名)组建了国内第一个专注于城市规划大数据与智慧城市的网络社区平台“城市数据派”,同时提出了《城市大数据人才培养计划》,致力于培养城市规划大数据人才。国匠城作为国内传播城市规划信息的专业平台,也上线了城市数据研习社,一方面提供技术培训,另一方面构建了大数据共享平台。
3 城市规划行业大数据应用的困难
3.1 数据门槛
虽然城市规划行业大数据应用已经如火如荼的展开,但从整体研究趋势来看全行业大数据应用仍面临三大门槛。
数据门槛
数据来源门槛是目前城市规划行业第一大门槛。
目前数据来源有3大方面:
1 首先是通过项目口径从有关政府部门,但此类数据大多为某一部门业务数据,涵盖面较为狭窄,同时由于保密安全等要求使政府数据在调取过程中也面临着重重困难。
2 其次是直接与商业公司购买相关数据,目前全国各地兴起的大数据交易所(如贵阳大数据交易所)为大数据研究提供了全新的数据来源,但这种数据获取方式也存在着价格高昂及数据实时性不强的问题。
3 最后目前行业内最为普遍的数据获取方式还有编写爬虫软件抓取网络数据或者通过建设数据共享小组进行数据私下交换,这两种方式基本都无视网站Robots协议及知识产权,是确定的数据盗版行为,做普通研究问题尚不明显但如果真的应用于付费规划设计项目,则会面临知识产权纠纷。
技术门槛
有学者曾经总结过城市规划行业大数据研究的所需的专业技术支撑体系基本有8大门类,分别为数据库、云计算、算法、人工智能、大数据处理框架、数据可视化、数据分析挖掘、编程语言。这8类技术对于IT从业人员即便是精通任意一只都足以成为某一领域的专家。
对于我们这些本科教育仅有高数数三跟计算机二级水平的城市规划专业教育背景的规划从业人员这一技术门槛无异为天堑。
从国内主要设计院的技术储备来看,即便是作为领军人物的中国城市规划设计研究院2016年也仅招聘了3名计算机工程类及1名GIS专业技术人员,更别说普通的规划设计院。孱弱的技术储备、人员储备在让很多规划行业从业人员在面对大数据技术巨大的技术门槛时产生了绝对的无助感,也正是如此部分国内设计院在成立技术创新中心、创新所后成绩有限。
同时目前规划行业在大数据分析方面大多仍旧以大数据展示及人工分析、总结规律方法为主,在面对TB、PB级海量数据的时候,这种方法需要大量的人工投入,这也严重制约了对城市现象的探究。
资金门槛
大数据研究是典型的高技术、高资金占用的领域,其资金投入主要包括数据采集成本、数据传输成本、数据存储及分析设备成本等。
在数据源阶段,如果采购商业公司原始数据的话,其花销相当可观。例如笔者所在地城市计划与当地某电信运营商购买当地1年期手机信令数据用以进行大数据研究,结果电信运营商给出了1500万元信息费的报价!我院还曾经与专业的手机信令数据分析公司合作,对城市部分轨道站点的手机信令数据进行采集分析用以研究轨道站点客流量数据,短短几周的部分站点数据的采购及分析成本就已达到20-30万元。
国内在新技术投入力度较大的某东北地区地方规划院也仅提出了3-5年内投资1亿元进行技术创新,与此收费相比仍旧相形见绌。在数据存储及分析层面,大数据动辄TB、PB级别的数据量必需用到Hadoop等分布式计算技术,这远非传统规划院、高校普通工作站及常规服务器能够承担的,即便是利用现在快速发展的云计算技术其成本经常也难以承受。
4 城市规划行业大数据的期望
4.1数据来源:原始数据正版化
首先对于数据来源而言,不论是官方统计数据、还是商业运行数据,大数据研究必需解决数据来源长期稳定及正版化问题,同时不同来源的数据还必须可以实现交叉验证及对比分析。否则规划行业的大数据研究将成为无本之木、无源之水,长期健康发展将无从谈起。
4 城市规划行业大数据的期望
4.2处理技术:大数据分析智能化
其次对于数据处理及分析技术而言,应当积极探索引入人工智能、机器学习,将人从大数据研究庞杂的简单脑力劳动中解放出来,让规划师回归城市规划技术本源,真正关注城市运行的客观规律。
4 城市规划行业大数据的期望
4.3实现形式:大数据服务平台化
最后对于大数据服务而言,希望能够出现越来越多的服务平台,真正将大数据从数据获取、数据存储分析、分析结果可视化呈现全过程实现一站式服务,让规划工作者直接购买大数据服务,让大数据技术可以更加便捷的应用到规划设计、城市管理、政府决策中去。也许这一平台不能解决城市中所有大数据分析的问题,但即便是只能解决常规规划问题中的人群、设施及交通等方面60%-80%的问题也不失为行业的重大突破。
对于行业大数据应用的未来,我们希望规划设计师不在天天讨论数据怎样爬取、怎样处理、怎样展示,在现在这个高度社会化分工的时代,难道想吃红烧肉一定要自己从猪仔养起吗?直接去超市买块猪肉、甚至直接叫份外卖岂不是效率高多了?
也许大家都担心BAT及三大运营商某一天觉醒过来会从更高技术维度毁灭我们这个行业,但是与其萎缩固步自封不如积极拥抱改变,让我们用更加开放的姿态去联合IT行业、电信行业,让规划师真正回归到城市规划的本源即关注城市运行规律,让其他行业的专业人士帮我们解决技术上的种种问题。
也许,BAT或者三大运营商哪一天就会推出这样一个一站式服务平台,也需这一天才是整个行业巨变的开始!
【参考文献】
【1】数据增强设计——新数据环境下的规划设计回应与改变[J]. 龙瀛,沈尧. 上海城市规划.2015(02)
【2】基于手机数据识别上海中心城的城市空间结构[J]. 钮心毅,丁亮,宋小冬. 城市规划学刊.2014(06)
【3】大数据在城市规划中的应用:来自北京市城市规划设计研究院的思考与实践[J]. 茅明睿.国际城市规划 . 2014 (06)
【4】大数据时代的精细化城市模拟:方法、数据和案例[J]. 龙瀛,茅明睿,毛其智,沈振江,张永平.人文地理 . 2014 (03)
【5】技术进步:从CAD到微博——技术因素如何影响规划进步[J]. 孙施文,乔建平,袁锦富,袁奇峰,周婕,茅明睿,马向明.城市规划 . 2013 (01)
这里有好多大数据干货,
快到城市数据派官网看去