查看原文
其他

2019开年大赛 | 上届优秀获奖团队专访:【王良】基于大数据的城市就业中心识别及其分类模型研究


本期导读


由中国城市规划学会城市规划新技术应用学术委员会与北京市城市规划设计研究院共同主办的第三届“城垣杯·规划决策支持模型设计大赛”已于2019年2月1日拉开帷幕,现已进入成果提交阶段(3月1日至4月30日),请参赛者于截止日期前提交成果,成果以“报名编号+参赛者姓名+项目名称”作为附件名称并回复至大赛官方邮箱:chengyuancup@city-if.com,点此了解大赛详情


作为本届大赛的合作媒体,城市数据派www.udparty.com受邀对第二届获奖代表进行专访。本期专访上届特等奖获得者,来自北京市城市规划设计研究院的王良、崔鹤合作完成的《基于大数据的城市就业中心识别及其分类模型研究》。王良作为团队代表接受采访,为你揭秘特等奖模型最大的特色、创新点、实用性等等,还有他的独家个人经验分享哦~


本期专访


王良

北京城市规划设计研究院



硕士,目前就职于北京城市规划设计研究院规划信息中心,毕业于北京师范大学数学科学学院。主要研究兴趣是基于数据支持的城市规划,包括大数据、数据挖掘、城市生长和地理信息相关方向。点击查看获奖作品展示PPT



城市数据派:作为第二届“城垣杯·规划决策支持模型设计大赛”的特等奖获得者,您觉得团队的模型为什么会脱颖而出?获奖模型的最大特色是什么?


王良:首先,感谢组委会和评审专家组的认可,我觉得我们团队的模型最大的特色在于以下几个方面,一是多源数据的集成应用,模型将常规的数据及手机定位、公交IC卡刷卡数据等新兴的大数据进行集成,用以解决城市就业中心识别及其分类的问题;二是多种模型的集成应用,由于模型研究的就业是城市中一个非常重要的行为,是城市发展的重要驱动力,针对就业中心的识别及其分类等实际问题,我们利用了聚类、分类等多种模型;三是多学科方法的借鉴,就业中心分类不局限于常规的技术方法,我们还借鉴生态学香农指数,度量就业中心内部产业多样性等。



图:技术路线



城市数据派:以前的传统套路是如何识别城市就业中心的?该模型对于传统套路而言,创新之处是什么?例如借鉴了跨领域的概念,即生物物种多样性概念来计算,类似的借鉴很有趣,为什么会用到生物物种多样性的概念?


王良:受限于数据来源和尺度,传统方法识别城市就业中心主要利用统计年鉴数据,借助空间相关性等分析方法,识别出以街乡办为最小尺度的就业中心,并利用Clark、Smeed等单中心或者多中心模型验证城市就业中心的空间分布形态。


我们团队的模型从就业中心的定义,利用手机定位数据、企业工商注册数据对区域内部就业中心进行识别,识别结果比传统统计数据尺度更精细。关于借鉴生物多样性的概念,主要基于城市就业中心和生物群体之间具有相似性考虑,例如竞争、依赖和“遗传”等等,生物多样性是衡量一定地区生物资源丰富程度的一个客观指标,它包括两个方面,其一是指一定区域内的物种丰富程度;其二是指生态学方面的物种分布的均匀程度。因此,我们借鉴用以表达生物多样性的香农指数,度量就业中心内部产业多样性。



城市数据派:你本硕都是数学专业,也曾经获得美国数学建模竞赛二等奖,请问数学专业的知识与技能对模型研究有什么支撑作用呢?模型设计一般需要具备哪些数据的基础知识与技能呢? 


王良:在读书期间,数学模型是一类系统评估方法,它是数学专业的重要内容,充分利用数学模型资源,增强对数学模型的理解,培养用数学模型的思维来解决实际问题的能力,这些在模型研究过程中,专业训练给了我很大的支撑。我认为模型设计一般需要三方面的技能,其一是数学基础(微积分、线性代数、数理统计和概率等);其二是数据理论知识,比如常用的算法和数据结构;其三是良好的编程基础,掌握一些高级语言,比如Python等,帮助你实现算法逻辑。



图:模型——系统评估方法




城市数据派:您在不同阶段的模型中使用了不同的算法,请问目前有哪些算法是规划师常用的?


王良:我们团队在模型中主要用到了聚类和分类算法,具体来说是,DBSCAN空间聚类算法和K-Means分类算法,K-Means算法规划师比较常用。



城市数据派:不同的模型是如何选择最佳的算法的?选择的主要标准有哪些?


王良:算法选择是个技巧性很强的工作,需要你对模型和数据的特征有了充分的了解后才能选好最适合的算法。我这里举一个研究过程中使用的DBSCAN聚类算法为例,聚类简单地说就是把相似的东西分到一组,聚类的时候,我们并不关心某一类是什么,我们需要实现的目标只是把相似的东西聚到一起。结合手机定位数据的特征,数据主要集中在使用者最常出现的区域,我们最终选择了DBSCAN聚类算法,主要是因为其对噪声不敏感,而且能发现任意形状的聚类。





城市数据派:根据这个研究规划成果,您对研究范围的城市就业空间组织的优化有哪些建议?


王良:模型研究过程中,我们共识别出了13个就业中心,分类结果:包括CBD、中关村、朝阳门、金融街和望京的一级就业中心,上地、六里桥等五个二级就业中心,清源、黄村等三个三级就业中心。随着北京就业的“多中心化”,北京市的通勤状况并没有的得到改善,反而过度通勤状况有所恶化,职住分离现象日趋严重,从研究的结果建议北京严控就业中心规模同时更应关注职住结构优化,强化各就业中心功能体系联动发展。



城市数据派:您觉得这个模型在实际应用中,需要注意哪些方面呢?目前这个研究适用于什么尺度的范围呢? 


王良:模型在实际应用中,应该注意在计算居民个体的职住地时用到的DBSCAN聚类算法中参数的选择,最小领域点数MinPts和领域半径Eps,需要根据数据量和精度来选择。由于数据是描述城市个体的位置信息,目前这个模型适用于研究城市个体的微观研究领域。



城市数据派:在北规院的规划项目业务中,有哪些项目是应用了此模型的成果?应用的效果如何?


王良:模型的主要方法和部分结论在新一轮《北京城市总体规划》中得以应用,部分结论纳入到《北京城市总体规划实施工作方案》中。模型为北京城市就业中心的识别和分级提出了更为直观、更有说服力的视角,并为改善北京城市交通出行压力提供更加科学的依据。



城市数据派:您认为模型在规划界的应用前景如何?在应用中有哪些注意点可以告诫广大规划师?


王良:城市是一个复杂的巨系统,城市中主要包括人口的聚集和经济活动的聚集,城市规划师在面对这样一个城市系统,对城市未来发展的预测仅凭描述性、经验性的分析方法已经不足以支撑,定量化的模型研究方法则用其更为直观、更有说服力的结论。大量涌现的城市现象与问题的可视化表达,也离不开量化分析的支撑。这种通过一系列数学公式,描述城市发展变化的规律与内在机制的方法,能够为我们揭示城市现象的产生,解决城市问题,促进城市未来发展提供更加科学的依据。


在使用模型方法时,选择合适的数据、标定合理的参数对于模型应用来说至关重要。北规院自上世纪80年代以来就率先开展定量模型技术辅助城乡规划决策的实践,自主研发的城乡规划决策平台搭载的多种规划决策模型对规划编制和管理提供了重要支撑,团队也将不遗余力地推动模型在规划行业的应用,同时支持更多的规划人员参与到定量模型的研究中。

图:数据化城市模型



城市数据派:作为上届竞赛大奖的获得者,在整个过程中,您认为研究中有哪些环节是最难的,您是怎么克服完成的呢?有哪些参赛经验可以分享给今年准备参赛的小伙伴们?


王良:我觉得我们遇到的比较大的挑战在于最终的成果汇报上,我们需要在有限的时间内,完整地、通俗地给在座的评审专家组介绍模型成果,且不乏专业性,还是蛮有挑战的。这里要特别感谢领导和同事们的帮助,在正式比赛前的演练中,领导和同事提出了很多有效的意见,使得成果逻辑思路更清晰,表达效果更好。


大赛获奖作品集


由中国城市规划学会城市规划新技术应用学术委员会、北京市城市规划设计研究院共同编制的《城垣杯•规划决策支持模型设计大赛获奖作品集(2017-2018)》正式出版,现已在各大电商平台出售,希望大家多多关注!点击了解详细内容


以下链接均可购买

京东:https://item.jd.com/41843618516.html

天猫:https://detail.tmall.com/item.htm?spm=a220z.1000880.0.0.iQB0I3&id=587455863602

微店:https://j.youzan.com/pO6S09


亚马逊、当当网及其他链接稍后奉上!


还可识别下方二维码,至中国建筑书店微店购买。


联系方式:荣先生、崔女士


联系电话:

(86)010-88076527

(86)010-88076673


电子邮件:

chengyuancup@city-if.com

cityds@bmicpd.com.cn


往期回顾

2019开年大赛 | 第三届“城垣杯·规划决策支持模型设计大赛”正式开启

2019开年大赛 | 往届大赛精彩回顾(一)——大赛设置及举办情况

2019开年大赛 | 往届大赛精彩回顾(二)——评选标准与作品特点

2019开年大赛 |报名截止提醒,倒计时三天


继续滑动看下一个
城市规划新技术应用专业委员会
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存