“神奇”大数据存在“先天不足”?
关于大数据,马云曾经举过一个生动形象的例子:
“我们今天掌握着大量数据,而且有些特别逗。”
“你们知道全中国胸罩最大的是哪几个省?我这都有!”
“最小的是哪几个省,知道吧?”
“浙江省!”
来自网友的评论:
“马云,不能因为你是浙江人就自黑!”
“浙江人民表示要卸载某宝!”
“哈哈哈很多人没明白,这是夸浙江女人聪明啊,有脑!”
如今,上至国家,下至企业,“大数据”概念已被“炒”到巅峰,正如哈佛社会学教授加里·金所说:“这是一场革命,庞大的数据资源使得各个领域开始了量化进程,无论学术界、商界还是政府,所有领域都将开始这种进程”。
那么,大数据终将带领人类开启信息文明的新篇章,还是依旧只是IT业发展中的浪花一朵?
大数据最大的时代进步在于超越了样本的局限性,解决了信息不对称问题。
众所周知,抽样的本质就是以局部推断全部,样本量越大则越接近现实,而大数据下的样本全覆盖无疑将推断过程变为现实的展示,甚至因信息的全放开而弱化了过去信息垄断下的“权威”。
如马云通过大数据平台中的中小企业交易情况比政府更早知晓中国外贸面临严重困境即为明证。
更为重要的是,大数据处理技术的不断跟进使得管理模式正超越传统。
一方面,大数据为国家管理提供了基础,实现资源的优化配置。如美国警察部门通过使用大数据技术对历史性逮捕模式、发薪日、体育项目、降雨天气和假日等变量进行分析,从而优化警力配置;
另一方面,企业通过大数据来挖掘潜在市场,从而实现“精确打击”,如阿里巴巴通过电商、蚂蚁金服、物流等环节积累的基础数据,以极低的成本准确评定每个商户的信用等级,将网商银行中小企业贷款坏账率控制在1%以内。
这也难怪西方各国将大数据视为“启动透明政府、引领社会变革、加速企业创新的利器”。
截止到2017年1月末,网商银行服务小微企业和经营者的数量达到271万户,覆盖全国23个省、直辖市和自治区;累计放款金额1151亿元;贷款余额331.93亿元,户均贷款余额为1.7万元。
不过,无论大数据如何神奇,若试图用大数据引领未来只会误入歧途,因为大数据背后本就存在着“先天不足”:
从本质上看,大数据最大的缺陷就在于试图以确定去“颠覆”混沌与不确定性。
若假定大数据真的管用,即是证明计划经济的正确性,因为大数据时代与计划经济时代虽然处于两个极端(信息全开放和信息全封闭),但其本质是一致的,即计划经济的前提是一切可事先安排,而大数据同样是以已知设定未来。
历史证明,世界的发展轨迹本是不确定的,计划只会不断被变化所牵制,以至于计划经济早已被扫进历史的故纸堆。
”以此推演,大数据的第二个问题也已呼之欲出,即大数据虽可通过对当下确定现实的反映来推断未来可能的趋势,却难捕捉隐匿在常规变量之外的,发生概率小却能引爆大变化和大拐点的“奇怪吸引子”或“黑天鹅”现象。
正如美国数据公司可以通过大数据推断恐怖分子行踪轨迹,却无法用模型预测出诸如“911事件”发生的可能性便可见一斑。
因此,大数据更多地只适用于社会运行处于常态下的预测,而当“大数据”遇上“黑天鹅”,其结果必然被后者所“颠覆”。
由此衍生的另一问题是,大数据所反映的现实真的属于当下么?事实上,大数据永远难以与现实同步,此为不足之三。
抽象的说,大数据虽能达到空间上的全面性,却无法保证时间上的一致性,而要在任何时空有效就需要时刻与现实相对应的即时数据,否则不同的数据代表的也仅仅是不同时空,其结果必然将因“时空错乱”而失真。
如企业通过大数据搜集所有消费者喜好并以此为导向设计产品,但结果却未能赢得市场青睐即是明证,因为在不同的时点都存在着太多足以改变人们偏好的对冲因素。
此外,大数据的深刻缺陷还在于,其仅是对现实的归纳,本身并不具有方向性,而决定趋势的是事物发展的内在关系,这恰恰是大数据所望尘莫及的。
因为形式多元的内在因子一方面并非都可以被数据化,同时,人作为内在因子的一部分本身就充满了变数,再复杂的数据模型也解决不了理解的千差万别。
换言之,大数据代表的是知识而非智慧,因此往往只能作为辅助的工具,而很多热捧大数据者显然是本末倒置了。
(福卡原创,欢迎转载)