查看原文
其他

GDP挤水分——戳破“数据谎言”

2018-01-15 王德培 福卡智库


世界上有三种谎言,分别是谎言、该死的谎言和统计数字。


去年初,辽宁省长在政府工作报告中首次对外确认,“辽宁省所辖市、县,在2011年至2014年存在财政数据造假的问题”,当时舆论一片哗然。网友纷纷讽刺“上级压下级,层层加码,马到成功;下级哄上级,层层掺水,水到渠成”的官场文化,甚至一针见血地指出“政府数据造假,又岂止辽宁、岂止GDP?”


果不其然,刚进入2018年,内蒙古就“自曝家丑”,称“自治区政府财政收入虚增空转,部分旗县区工业增加值存在水分”,调减2016年一般公共预算收入530亿元,占总量的26.3%;核减2016年规模以上工业增加值2900亿元,占全部工业增加值的40%。彼时,内蒙古可是凭借人均GDP11171万美元,在9个人均GDP超一万美元的省市中名列第七位,现在啪啪打脸了!

2016年内蒙古人均GDP过1万美元


之后是天津,将滨海新区2016年地区生产总值调整为6654亿元,缩水程度高达 1/3。

此前滨海新区公布的2016年地区生产总值为10002.31亿元,同比增长10.8%,其经济总量占到整个天津市1.79万亿元GDP的55.87%,是全国首个迈入万亿俱乐部的国家级新区,远超过浦东新区,排名第一。


调整后,直接影响就是天津市2016年GDP将下降到1.5万亿元以下,全国排名被重庆和苏州超越!有网友评论,“滨海新区变宾每新区”。


恐怕GDP注水并不限于上述几个地区。

2017年12月,审计署公布的一项数据显示,全国4个省份的10个市县(区)虚增财政收入就达15.49亿元;如果把过去几年各省市的GDP数据相加,其总和与总增速超出全国GDP的最终数据,也是常见的现象。

事实上,近些年每有数据出炉,社会都是抱着“半信半疑”的态度,或干脆“反着听”。


当然,这真不能怪老百姓“挑剔”,主要原因还是统计数据不靠谱。

老百姓感受到物价上涨如“兔子跑”,可CPI缓慢如“乌龟爬”;

明明是“千里朦胧,万里尘飘”,空气质量就是“睁眼说瞎话”地显示“优”;

企业一提税收叫苦不迭,“营改增”却是“累计减税1.7万亿元”;

此外,一直以来,每当全国城镇职工平均工资公布,许多人总感觉自己的收入“被增长”……


从某种程度上,耗费人力、财力、物力好不容易统筹出来的数据,在老百姓那里却变成了谎言,这真的是一种悲哀。


何以至此?


老百姓对数据“老不信”,说到底是担心“数据假”。


确实,从概念来看,数据即量值、数值、数目字,常常被人们拿来比较、衡量大小、多少等。


由此,数据一方面具有客观性,是多少就是多少,另一方面,一旦被拿来比较,数据又很容易被人为控制,戴上主观的“帽子”。


尤其在中国经济高速发展的30多年间,“官出数字、数字出官”,数据直接与政治前途挂钩,大部分官员都希望自己任下的各项指标是一些漂亮的数字。


在这种政风和心理下,统计数据也被异化为粉饰政绩的工具,这也是大部分人关于统计数据最“讳莫如深”的一点。


事实果真是这样子的吗?

且不说,从常理分析,谎报数据、扭曲现实是要承担巨大风险的,一旦造假被曝光,官员牺牲的就不仅仅是仕途,更可能是一生的名誉,如此“埋地雷”的行为不会是大多数官员的选择,顶多就是“讲好的、避差的”;

另一方面,从技术上看,诸如GDP、财政数据等与投资、消费、进出口、发电数据密切相关,通过关联分析识别数据造假不难,铤而走险的机会成本太高。


所以,从这些层面来看,社会上沸沸扬扬的“怀疑论”,如“一个辽宁倒下去,千百个省市顶上来”可以歇歇了,统计数据失真≠假数据!


虽然由于统计方法或人为掺水等多重因素干扰,数据不可避免地存在“假”的因素,但真数据多,假数据少,量大面广的统计数据可以一定程度上反映现实。


“世界上有三种谎言,分别是谎言、该死的谎言和统计数字”,马克·吐温如此说。


既然数据不假,为何常常充斥着“谎言”?结构是关键,具体来看:


1)数据指标不合理,典型如CPI。

统计局数据显示,2016年CPI同比上涨2.0%,而事实上,整个2016年,房价的涨势根本停不下来,消费价格指数与公众感受到的大相径庭。


原因就在于,在CPI计算中,兼具居住和投资属性的房价根本没有列入,仅仅将与居住相关的装修、房租、水电煤等费用列入其中,占比20%。


一边是“买房成为中国人一辈子买得最贵的商品”,另一边是CPI不包含房价波动,怎能“以数服人”?


2)样本不具有代表性。

英国脱欧和特朗普逆袭是近两年来全球最大的两只“黑天鹅”,讽刺的是,统计数据在这两大事件上不约而同地跌了“大跟头”。


如脱欧公投前,舆论、媒体和调查机构都对留欧信心满满,卡梅伦本想以退欧为条件对欧盟敲竹杠,不料被民意玩脱。


事后方才得知,调查公司的数据来自于网络,毫无疑问,留欧的年轻人和高知识精英是主要覆盖人群,而事实上,相当比例、较少使用互联网的老年人群被遗漏了,而他们恰恰是脱欧派。


3)数据统计背后的“潜意识”魅影。

即便指标“无可挑剔”,样本“无所不包”,也很难保证统计数据的“无懈可击”。


因为统计行为就好比以上帝的视角召唤一种集体潜意识:即超级机构在汇聚信息。


很显然,这种自上而下的、金字塔式的压迫感,将微妙地影响样本的真实性,最终的结果往往是“权威”想看到什么结果便可获得什么结果。

显然,数据不假、结构假才是统计数据屡屡失真的主要原因。

伴随着互联网的进一步发展,“大数据”惊艳世界,企业界、学术界、IT行业等无不想挤上大数据这辆豪华大巴。


相较于传统数据,由于建立在海量信息之上,种类齐全且实时性强,特别是其采集没有任何“仪式感”,而是每个人日常生活的数据碎片,所以,大数据确实更贴近现实。


不过,大数据的优势建立在“大”之上,但同时由于其“数据”本性,又注定了其短板所在。

一方面,即便用尽所有的科技手段,剔除假数据,收集到无限多的原始数据也很难掌握真理。因为相比收集数据的“简单”,还原冷冰冰的数据背后隐藏的千丝万缕的联系却是相当复杂的,你看得到一和二,往往看不到三乃至更多,细微之极,非一个机械的数据模型所能完全涵盖;

另一方面,无论传统统计数据,还是披着“高精尖”外衣的“大数据”,所有的数据都是以往已经发生了的经济现象的总结,其结构总是滞后于现实的,在社会发展进程中,很多小荷渐露的新变化往往不被涵盖在历史统计模型中,这是数据的“宿命”,也是“数据不假、结构假”的深层次原因!


更进一步分析,眼下不仅是一个急速变化的时代,更是一个系统切换的时代,倘若说过去几百年来工业经济下的数据分析方法“弥久不衰”,在新经济如雨后春笋般涌现之际,当突变、震荡成为常态,“数据为王”也将被大打折扣。


如体验经济大行其道,消费者在体验场景中收获了多大程度的满足?不要说商家难以揣测,恐怕连消费者本人都无法用一个准确的数字描绘出来,因为情感因人因时因地而异,根本无法用数据做定量分析。


再如,长远来看,量子力学已经叩响新时代的最强音,届时,神奇的“幽灵力量”将在方方面面施展魔力,颠覆人类的认知。


如事物与事物的关系变化莫测,结构难以捉摸,很多看似“风马牛不相及”的领域却在相互影响。


所谓“皮之不存,毛将焉附”?当个体之间的显性结构被打破后,再去追究数据的真假也会变得无足轻重。


事实上,说到底,数据就是个辅助工具,是“死”的,其价值力还在于分析本身,这一点不论是大数据、云计算、物联网等都不可能改变,“得数据者未必得天下”。


尤其在这个信息大爆炸时代,乱花渐欲迷人眼,想要单纯依靠数据分析无往不胜更是“自欺欺人”,这一点对于那些盲目扎进“大数据”领域的企业家而言,恐怕是比戳破“结构假”的“数据谎言”还要残酷的现实!

 


精彩推荐

为何西方国家不玩全球化了?

医改的“牛鼻子”在哪里?

真正的无人驾驶要等40年?

人民币汇率从跌宕起伏到左右逢源

金将军回心转意还是缓兵之计?

法国“小马哥”来了

谁能成为领袖城市?

中东为何成为“火药桶”?


(福卡原创,欢迎转载)


您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存