其他
缺了背景的公交数据分析 不但浅薄粗暴还杀人诛心
The following article is from 虚无清秋斋 Author 徐泊廷
原标题:公交数据分析之陋见
仔细看了一篇“高大上”的交通数据分析文章,其数据详实、指标丰富、图表华美。如果这篇文章只做现状特征客观描述,少点虚妄结论,多点真正问题的探索,不失为一篇好文章。当然交通不是我专业,数据分析不是我专业,只是略知皮毛。纯粹从一个门外汉的角度,粗浅谈谈。一、数据分析有助于认识事物发展规律通过开展多层次数据分析,有利于掌握当前事物发展的状态。样本容量、总量分析、结构分析、趋势分析、情景分析、相关性分析、信度效度分析等确实是个专业事情,需要一些统计专业能力;而且数据、指标的价值及其意义,高度依赖于数据口径、统计方法等定义。以公共交通交通来说,诸如客流量及其分布特征,线路长度、非直线系数及线网密度、线网重复系数、发车密度等每一个都有其价值,每一个指标都可以描述公共交通当前对应的现状。指标体系中的每个指标都有其功能,并可通过设定标准判断或对比优劣高低;以参考标准可以快速找到有价值的异常,为挖掘背后存在的问题提供了快速入口;通过指标及其关联指标组合,结合趋势分析、结构分析等有助于揭示指标之间的关系及其影响规律。从功能角度看,数据分析是认识世界、改善世界的一个工具。二、数据分析所描述现状不代表问题数据分析是个高度专业活,你能看到的数据取决于发布者数据分析目的及其想传达的信息。当要揭示全国各城市公共交通的营运情况,通过总量指标及其趋势分析就有个大概判断;但要认识具体城市公共交通的营运情况,就需要更多指标、更深入分析。比如谈起年公交客流强度(特定区域特定周期公交客运人次÷对应载客里程),其值受到到很多因素影响:统计区域、人口密度、500米公交覆盖率、谷平高峰发车间隔、公交相对小汽车车速等。
认识一个城市公共交通,简单做客流强度总量分析就会显得浅薄,需要叠加更深入分析:分区域的结构分析,避免简单平均掩盖的结构性问题;多指标趋势分析,揭示驱动变化的主要因素,避免想当然;选择统计对象特征差不多的城市做横向比较,有助于揭示差异。在不同人口密度区域的公交客流强度值,其代表的意义不一样,导致需要解决的问题及其目标也不一致。如低人口密度区域,低客流强度有其合理性,追求高客流强度除了不切实际以外,也将驱动管理不断扭曲;在高人口密度区域,持续下降的公交服务水平或能实现客流强度提升,但并不代表公交吸引力提升,很可能是侧重高峰期营运而大幅减少平低峰运行的策略所致;因公交专用道等优先措施缺失,公交服务水平越来越低、车速越来越慢、越来越不可靠等问题只会加剧,在公交优先措施不支撑情况下追求客运强度目标,只能证明管理的碎片化而无真正价值。比如轨道与常规公交线共站问题,是竞争关系还是共生关系?是否可以用共站数量来定义其关系?比如公交行业成本分析,各地公交成本构成因资源差异、投入模式、补贴政策等具有较大差异性,成本规模不一定具有可比性;比如公交行业的收入结构,会受交通政策、人口结构、换乘优惠、优惠力度、免票政策存在的差异影响,如刷卡优惠力度大的地方现金收入少,老年人占比多的地方票款收入低,有一次去山东某个城市,一上车全是老年免票乘客。
上述粗浅的认知,源于自己粗浅的数据分析经验与经历的坑,得益于追逐逻辑自洽的自觉与实践,不一定对和全面,做抛砖引玉之用。
作者:徐泊廷 来源:虚无清秋斋
更多阅读: