GDP挤水分——戳破“数据谎言”

Original 2018-01-15 王德培 福卡智库

“

世界上有三种谎言，分别是谎言、该死的谎言和统计数字。

”

去年初，辽宁省长在政府工作报告中首次对外确认，“辽宁省所辖市、县，在2011年至2014年存在财政数据造假的问题”，当时舆论一片哗然。网友纷纷讽刺“上级压下级，层层加码，马到成功；下级哄上级，层层掺水，水到渠成”的官场文化，甚至一针见血地指出“政府数据造假，又岂止辽宁、岂止GDP？”

果不其然，刚进入2018年，内蒙古就“自曝家丑”，称“自治区政府财政收入虚增空转，部分旗县区工业增加值存在水分”，调减2016年一般公共预算收入530亿元，占总量的26.3%；核减2016年规模以上工业增加值2900亿元，占全部工业增加值的40%。彼时，内蒙古可是凭借人均GDP11171万美元，在9个人均GDP超一万美元的省市中名列第七位，现在啪啪打脸了！

2016年内蒙古人均GDP过1万美元

之后是天津，将滨海新区2016年地区生产总值调整为6654亿元，缩水程度高达 1/3。

此前滨海新区公布的2016年地区生产总值为10002.31亿元，同比增长10.8%，其经济总量占到整个天津市1.79万亿元GDP的55.87%，是全国首个迈入万亿俱乐部的国家级新区，远超过浦东新区，排名第一。

调整后，直接影响就是天津市2016年GDP将下降到1.5万亿元以下，全国排名被重庆和苏州超越！有网友评论，“滨海新区变宾每新区”。

恐怕GDP注水并不限于上述几个地区。

2017年12月，审计署公布的一项数据显示，全国4个省份的10个市县（区）虚增财政收入就达15.49亿元；如果把过去几年各省市的GDP数据相加，其总和与总增速超出全国GDP的最终数据，也是常见的现象。

事实上，近些年每有数据出炉，社会都是抱着“半信半疑”的态度，或干脆“反着听”。

当然，这真不能怪老百姓“挑剔”，主要原因还是统计数据不靠谱。

老百姓感受到物价上涨如“兔子跑”，可CPI缓慢如“乌龟爬”；

明明是“千里朦胧，万里尘飘”，空气质量就是“睁眼说瞎话”地显示“优”；

企业一提税收叫苦不迭，“营改增”却是“累计减税1.7万亿元”；

此外，一直以来，每当全国城镇职工平均工资公布，许多人总感觉自己的收入“被增长”……

从某种程度上，耗费人力、财力、物力好不容易统筹出来的数据，在老百姓那里却变成了谎言，这真的是一种悲哀。

何以至此？

老百姓对数据“老不信”，说到底是担心“数据假”。

确实，从概念来看，数据即量值、数值、数目字，常常被人们拿来比较、衡量大小、多少等。

由此，数据一方面具有客观性，是多少就是多少，另一方面，一旦被拿来比较，数据又很容易被人为控制，戴上主观的“帽子”。

尤其在中国经济高速发展的30多年间，“官出数字、数字出官”，数据直接与政治前途挂钩，大部分官员都希望自己任下的各项指标是一些漂亮的数字。

在这种政风和心理下，统计数据也被异化为粉饰政绩的工具，这也是大部分人关于统计数据最“讳莫如深”的一点。

事实果真是这样子的吗？

且不说，从常理分析，谎报数据、扭曲现实是要承担巨大风险的，一旦造假被曝光，官员牺牲的就不仅仅是仕途，更可能是一生的名誉，如此“埋地雷”的行为不会是大多数官员的选择，顶多就是“讲好的、避差的”；

另一方面，从技术上看，诸如GDP、财政数据等与投资、消费、进出口、发电数据密切相关，通过关联分析识别数据造假不难，铤而走险的机会成本太高。

所以，从这些层面来看，社会上沸沸扬扬的“怀疑论”，如“一个辽宁倒下去，千百个省市顶上来”可以歇歇了，统计数据失真≠假数据！

虽然由于统计方法或人为掺水等多重因素干扰，数据不可避免地存在“假”的因素，但真数据多，假数据少，量大面广的统计数据可以一定程度上反映现实。

“世界上有三种谎言，分别是谎言、该死的谎言和统计数字”，马克·吐温如此说。

既然数据不假，为何常常充斥着“谎言”？结构是关键，具体来看：

1）数据指标不合理，典型如CPI。

统计局数据显示，2016年CPI同比上涨2.0%，而事实上，整个2016年，房价的涨势根本停不下来，消费价格指数与公众感受到的大相径庭。

原因就在于，在CPI计算中，兼具居住和投资属性的房价根本没有列入，仅仅将与居住相关的装修、房租、水电煤等费用列入其中，占比20%。

一边是“买房成为中国人一辈子买得最贵的商品”，另一边是CPI不包含房价波动，怎能“以数服人”？

2）样本不具有代表性。

英国脱欧和特朗普逆袭是近两年来全球最大的两只“黑天鹅”，讽刺的是，统计数据在这两大事件上不约而同地跌了“大跟头”。

如脱欧公投前，舆论、媒体和调查机构都对留欧信心满满，卡梅伦本想以退欧为条件对欧盟敲竹杠，不料被民意玩脱。

事后方才得知，调查公司的数据来自于网络，毫无疑问，留欧的年轻人和高知识精英是主要覆盖人群，而事实上，相当比例、较少使用互联网的老年人群被遗漏了，而他们恰恰是脱欧派。

3）数据统计背后的“潜意识”魅影。

即便指标“无可挑剔”，样本“无所不包”，也很难保证统计数据的“无懈可击”。

因为统计行为就好比以上帝的视角召唤一种集体潜意识：即超级机构在汇聚信息。

很显然，这种自上而下的、金字塔式的压迫感，将微妙地影响样本的真实性，最终的结果往往是“权威”想看到什么结果便可获得什么结果。

显然，数据不假、结构假才是统计数据屡屡失真的主要原因。

伴随着互联网的进一步发展，“大数据”惊艳世界，企业界、学术界、IT行业等无不想挤上大数据这辆豪华大巴。

相较于传统数据，由于建立在海量信息之上，种类齐全且实时性强，特别是其采集没有任何“仪式感”，而是每个人日常生活的数据碎片，所以，大数据确实更贴近现实。

不过，大数据的优势建立在“大”之上，但同时由于其“数据”本性，又注定了其短板所在。

一方面，即便用尽所有的科技手段，剔除假数据，收集到无限多的原始数据也很难掌握真理。因为相比收集数据的“简单”，还原冷冰冰的数据背后隐藏的千丝万缕的联系却是相当复杂的，你看得到一和二，往往看不到三乃至更多，细微之极，非一个机械的数据模型所能完全涵盖；

另一方面，无论传统统计数据，还是披着“高精尖”外衣的“大数据”，所有的数据都是以往已经发生了的经济现象的总结，其结构总是滞后于现实的，在社会发展进程中，很多小荷渐露的新变化往往不被涵盖在历史统计模型中，这是数据的“宿命”，也是“数据不假、结构假”的深层次原因！

更进一步分析，眼下不仅是一个急速变化的时代，更是一个系统切换的时代，倘若说过去几百年来工业经济下的数据分析方法“弥久不衰”，在新经济如雨后春笋般涌现之际，当突变、震荡成为常态，“数据为王”也将被大打折扣。

如体验经济大行其道，消费者在体验场景中收获了多大程度的满足？不要说商家难以揣测，恐怕连消费者本人都无法用一个准确的数字描绘出来，因为情感因人因时因地而异，根本无法用数据做定量分析。

再如，长远来看，量子力学已经叩响新时代的最强音，届时，神奇的“幽灵力量”将在方方面面施展魔力，颠覆人类的认知。

如事物与事物的关系变化莫测，结构难以捉摸，很多看似“风马牛不相及”的领域却在相互影响。

所谓“皮之不存，毛将焉附”？当个体之间的显性结构被打破后，再去追究数据的真假也会变得无足轻重。

事实上，说到底，数据就是个辅助工具，是“死”的，其价值力还在于分析本身，这一点不论是大数据、云计算、物联网等都不可能改变，“得数据者未必得天下”。

尤其在这个信息大爆炸时代，乱花渐欲迷人眼，想要单纯依靠数据分析无往不胜更是“自欺欺人”，这一点对于那些盲目扎进“大数据”领域的企业家而言，恐怕是比戳破“结构假”的“数据谎言”还要残酷的现实！

精彩推荐

（福卡原创，欢迎转载）

《鱿鱼游戏2》今天下午四点开播，网友无心上班了，导演悄悄剧透

紧急通告！三高的“克星”终于被找到了！！不是吃素和控糖,而是多喝它....

话费充值活动来了：95元充值100元电话费！

跟着南通住建局学“朝令夕改”

宾曰语云被法学教授投诉：严重侵权，“违法犯罪”！