☞『独家』【院士大数据论坛】倪光南:迎接大数据时代的来临〖NO3下篇〗
▌新朋友:点击标题下面蓝色字 ☞“软件定义世界(SDX)” |
【院士大数据论坛】专题共为大家准备了4篇文章,第一篇是李国杰院士的《谈大数据时代的国家治理》,主要从政府数据开放共享角度讨论大数据;第二篇是邬贺铨院士的《大数据时代的发展趋势》,主要通过一些鲜活的案例、详实的数据分析大数据的发展趋势;第三篇是倪光南院士的《迎接大数据时代的来临》,主要从大数据特征、发展历程、经典案例、研究范式、生态系统、行业应用实践等深入浅出的分析大数据的历史、现状和趋势及存在的主要问题。第四篇是李德毅院士有关大数据论述的文章,敬请期待!
编者注:本文原载于2013年《信息化蓝皮书》,题名《迎接大数据时代的来临》,共分四节,其中,第一节叙述大数据的发展、特征和处理流程,第二节论述大数据和云计算的关系,第三节论述大数据和标准的关系,第四节叙述大数据的应用及相关问题。第一节和第四节由倪光南院士编写,第二节由姚宏宇撰写,第三节由何克清撰写。本文节选第一节和第四节,分两期刊登。本期刊登的是下篇--《第二节 大数据的应用》,上篇请看昨天刊登的《第一节 从商业智能到大数据》。
『独家』【院士大数据论坛】倪光南:迎接大数据时代的来临〖NO3下篇〗
文:倪光南
倪光南,1939年出生,现为中国科学院计算所研究员,中国中文信息学会理事长,中国工程院院士。曾任北京市人民政府参事。系第八届全国人大代表,第八届、第九届全国政协委员,第五届全国青联特邀委员 。联想集团首任总工程师。作为我国最早从事汉字信息处理和模式识别研究的学者之一,提出并实现在汉字输入中应用联想功能。
第二节 大数据的应用
一、典型的大数据应用
(一)数据可视化
数据可视化是关于数据之视觉表现形式的研究;其中,这种数据的视觉表现形式被定义为一种以某种概要形式抽提出来的信息,包括相应信息单位的各种属性和变量。数据可视化主要旨在借助于图形化手段,清晰有效地传达与沟通信息,并且早在大数据出现之前就已经被广泛地应用了;但在大数据领域,可视化技术具有了更大的作用。
在传统应用中,可视化主要是能更清晰有效地表示大量多维度的数据,能更好地反映变化趋势等等,在大数据应用中,除了有这些作用外,由于大数据中隐藏的模式和趋势可能很隐蔽,不容易被人所洞察,而通过合适的可视化技术展示出来后,可能会有助于揭示其中隐藏的模式和趋势。
图4-1 美国全国枪击死亡情况
来源:《可视化数据告诉你美国枪击案到底多严重》[28]
图4-1为2010年美国全国枪击死亡数据的可视化表示。图中的横轴为年龄,每一条弧线代表一个被枪击致死的人。弧线的起点为0岁,终点为他可能活到的年纪。每条线段有橘色和灰色两部分。中间的分界点正是他被枪击身亡的年纪。2010年全美一共有9595人死于枪击,这近万条弧线层层叠叠,橘色与灰色交割的图景,使人对这一情况获得了比简单数字或简单报表远为深刻和全面的了解,显示出可视化的威力。
图4-2 全球运营商提供的国际干线带宽
来源:《 Bandwidthexplosion: As Internet use soars, can bottlenecks be averted?》[29]
同样,对于像“全球运营商提供的国际干线带宽”这种非常复杂的数据,可视化技术能使人获得比枯燥的数字表达更好的了解。
(二)关联性分析
通常情况下,如果观察到X和Y在给定条件下是始终关联的,这在已知X的情况下预测Y是有用的,反之亦然。换言之,即使没有阐明因果关系,X和Y也可以彼此作为预测指示器。Google的总经济师Hai Varian认为,“即使你全部拥有的只是短时的关联性,你在报道的价值上已领先6周了。我们的希望是,如果你能实时地感知经济脉搏,你将能更快地对异常情况做出响应”。
很多时候,从新的数字数据源提供的数据中发现的关联性会正确地反映传统的官方统计,从而能提供更便宜、更快的、近似的预测。例如,MIT研究者通过收集和分析在网上销售或作广告的商品的价格,能以很高的准确性估计通货膨胀率。这一方法的主要价值在于,在线价格可以每天获得,而消费价格指数在大多数国家只是按月发布的。这样,这一方法就可以比传统方法更早地检测通货膨胀的出现。
一个著名实例是谷歌在2008年发表的基于类似流感症状查询的“谷歌流感趋势研究”。研究报告发现,“特定查询的频率在很大程度上与病人向医生陈述类似流感症状的就诊情况关联”,据此可以“精确地估计美国每个地区当前的传染水平,报告的滞后期只有一天”。结论是,在一个具有大量搜索用户的地区,有可能利用搜索查询状况来检测传染病的流行情况。当应用于公共保健时,在线数据被用作症状监测的部分手段,也称为信息传染病学。美国疾病控制和预防中心(CDC)认为,挖掘与健康有关的海量数据有助于在医疗或实验室确诊之前,预测疾病的爆发。“谷歌登革热趋势”以同一方式工作,显示出类似的效果。图4-3上蓝色线为该系统的估计数据,橙色线为巴西官方的数据,两者高度吻合。由于该系统的估计数据几乎可实时发布,而官方的数据往往要滞后许多天,这使该系统对预测疾病或掌握传染情况很有价值。
图4-3 “Google登革热趋势”网站屏幕截图
来源:http://www.google.org/deguetrends/about/how.html
推特有类似的用途。John Hopkins大学的计算机科学家运用一个复杂的算法,从超过20亿条推特帖子中,选择分析了美国从2009年5月到2010年10月的超过160万条涉及健康的帖子,发现官方流感传染率数据与基于他们的数据建模所得到的流感传染率数据高度符合,两者的关联度达到0.958。显然,基于上述同样理由,根据社会媒体的数据进行分析也有很大的价值。
图4-4 美国流感传染率的官方数据与基于推特的数据比较
来源:《You Are What You Tweet:Analyzing Twitter for Public Health》[30]
其他数据流也可以引入或叠加在社会媒体上,特别是地理信息。如果大数据分析中整合通过移动电话等取得的地理信息,再结合可视化技术将传染病传播趋势在地图上呈现出来,也就是将天气预报的方式用于疾病预报,可以使人们像预防风暴一样预防疾病的袭击,这样的应用是很有前景的。
(三)经济学、社会学应用
发现相关性只是手段,重要目的是利用相关性以及其他手段来发现人类社会活动的异常,帮助制订正确的反应策略。例如,国际食品政策研究所(IFPRI)的研究者们开发了一种方法用来检测过高食品价格的冲击,以确定适当的国家层面的食品安全响应,例如确定何时释放食品库存等。
利用大规模实时信息源可以帮助救生。美国地理测量会(USGS)开发了一个系统,它监测推特以发现关于地震的大量消息的爆发,然后提取出地区信息送给USGS的地震学团队,验证是否出现了地震,并确定震中和震级。运行表明,触发警报的90%报告是正确的。类似地,最近在哈佛和MIT的学者对海地2010年爆发霍乱的情况进行了回溯分析,发现挖掘推特和在线新闻,可以有二周的提前量给官员提供关于疾病实际传播情况的很准确的指示。
此外,许多实例表明,许多新数据源的价值不仅在于它的规模和速度,还在于它所包含信息的丰富性。在许多情况下,大数据不仅是官方统计数据的代替或作为它的近似,而且能对它进行补充,增加深度和细节。虽然在用推特数据进行症候监测的情况下,有的专家认为新的数据流还不够准确,不能替代人工检测的传统方法;但是,也有专家认为,从人们未给他们的医生共享的信息中,可以知道许多有价值的信息。看来,定性的社会媒体信息越多,越有助于描绘出一个关于事件的全貌,便于做出快速响应。这里,大数据的规模、速度和数据本性的组合具有很大的价值。
图4-5 在印尼的推特上,讨论米价的帖子和实际米价的关系
来源:http://www.unglobalpluse.org/projects/twitter-and-perceptions-crisis-related-stress
一项由Global Pulse和社会媒体分析公司Crimson Hexagon推动的联合研究,分析了关于美国和印尼的食物、燃料和住房信息的1400万条推特数据,旨在更好地了解人们所关注的问题。将推特数据和“afford(买得起)”这类主题词关联起来,研究对话所涉及的话题和数量如何随时间而变化,从而反映了居民所关心的这些问题的发展趋势。例如在印尼推特上提到米价的帖子数目和实际食物涨价的官方统计数据有密切的关系。图4-5中,上方是推特上讨论米价的帖子数量,下方是实际的米价,显然,两者有很高的符合程度。而图4-6表示一项由Global Pulse和SAS研究所的联合研究计划。它通过观察美国和爱尔兰的社会媒体来分析失业,该研究发现,在爱尔兰的公众博客、在线论坛和新闻上,与雇佣关联的、带有困惑情感的对话数量,早在官方失业率增加数据公布前三个月就已显著增加了;但在美国,关于失去住房的对话在失业率高峰的两个月以后才增加起来。该研究发现,失业的领先标志是:居民降低购买汽车档次,减少杂品开销,增加公共交通;而失业的滞后标志是:增加典押和出租,减少保健开支,增加撤销度假。类似的研究当然也可以在因特网渗透率很高的发展中国家进行。
图4-6通过观察社会媒体揭示了领先于或滞后于失业高峰的某些标志
来源:《Can a country's online"mood" predict unemployment spikes?》[31]
上述这些情况表明,如果适当地进行分析,大数据可以用来更好地理解人们的行为,Global Pulse的白皮书认为,在全球发展领域,大数据可在三个主要方面提供支持:
1.早期预警:早期检测居民使用的数字设备和服务中发生的异常,可以在时间上快速响应危机;
2.实时感知:大数据可以描绘一幅关于现实情况的、粒度很细的且即时的表述,它有助于制定政策和行动计划;
3.实时反馈:大数据具有实时监测居民的能力,使其可用来了解什么地方政策和行动计划失效并做出必要的调整。
这些应用都有很大的前景。但我们知道,要将大数据源变为用于发展经济的可操作的信息,挖掘大数据的宝贵价值,没有自动的、简单的途径,我们还有许多需要注意的问题和事项。
二、大数据应用需要注意的问题
(一)大数据的缺陷和样本偏差问题
大数据的一个重要来源是使用因特网和社会媒体的在线用户,他们产生的数据内容中可能包含着欺骗或恶作剧的成分,但这并不是新问题,何况现在发现问题、澄清问题的速度也可以大大加快,所以不必因为新型数字数据来源包含缺陷而不敢应用,当然,要有清醒的认识和采取必要的防范措施。
即使数据提供者主观上并无恶意,但他们通过因特网和社会媒体表达的知觉可能是错的或不能担保正确的,例如某个人报告了一种疾病的症状,但可能不是真正有人感染了疾病,只是症状相似而已。这就需要分析者正确地予以处理,不要被它造成误导。另外,在一些场合,监视症状也是很重要的。
在大数据中如何选择样本也是很重要的问题。样本是否有代表性会直接影响大数据分析的结果。现在,越来越多的数据是通过手机提供的,在一些不发达地区,手机的使用不普遍,采用手机数据作为样本可能会产生样本偏差,但随着时间的推延(目前即使在大多数发展中国家,手机的使用也越来越普遍),由此导致的样本偏差问题将会越来越小。
有时样本的偏差甚至是有用的,例如,MIT的Billion PricesProject发现,在拉丁美洲很少零售商采用网站做广告,采用在线价格作为价格分析的样本,肯定会有样本偏差,但结果反而很好,这是因为零售商会在实体市场价格上升的二三周前就提高在线价格,因为他们知道,他们较富有的客户基础(在线购买者)能承受这种冲击。所以分析在线价格可以提前反映实体市场的价格趋向。这里的关键在于,要了解潜在的偏差并知道它可能带来的影响。
这些情况说明,当大数据的局限性、偏差、最终特性等能被适当地理解,并在解释数据时予以考虑的话,它能够很好地满足需求。这些新的数字数据源不一定最适合导出严密的科学分析,但他们对一大批应用具有巨大的潜在价值。
(二)因果关系问题
在利用大数据分析时,对于因果关系的判断,我们有两点需要注意,一是有关联不代表有因果关系,二是一些伪关联情况也可能会造成有因果关系的分析结果假象。
1.关联不一定意味着有因果关系
在大数据集之中如何发现关联性是一个困难的问题,并存在可能被误导的危险;也就是说,从数据分析中发现了关联性并不等于发现了因果关系,有许多情况表明,关联性不应被误解为因果关系。例如Google Correlate是一个工具,它用来验明在两组联机搜索模式之间的最佳拟合。运用这一工具发现,美国从2004年起的搜索中,“增重”(4-7图上的蓝线)和“出租公寓”(图4-7上的红线)之间的拟合度为0.9(90%),显然,很难解释它们之间会有任何因果关系。这个例子再一次表明分析者的重要,他们应具有足够的知识,不被表面上的关联性所误导。
图4-7关联不一定意味着有因果关系
来源:Google Correlate
2.蕴含情况也不是因果关系
另一类伪关联属于“蕴含”情况。社会学家Jim Fruchterman提供了两个关于伪关联的实例,都属于蕴含情况而非因果关系。一、儿童阅读技能与他们所穿鞋子尺寸之间有很强的关联性,但这是因为较大的孩子有较大的脚并通常阅读得更好;显然,在评估儿童阅读能力时,不必去测量一个教室里所有鞋子的尺寸。二、溺毙率较高的地方与冰淇淋销售额较高的地方关联,但这是因为人们在又热、又有水的地方休闲时,如在游泳池和海边,往往会吃冰淇淋并去游泳。显然,如要防止溺毙,我们不必去构建一个监视冰淇淋销售商的系统。
另外,发现有行为的变化时还要注意,许多数据会受到模仿倾向的影响,例如媒体上广泛出现价格上升的报道,那么会促使更多的人去搜索这些术语,形成某种正反馈。而且,有时行为的变化是由不同时期造成的,如学校在假期的情况与上课期间的情况是很不相同的,因为假期里学生大量离开了,会造成观测到的行为发生变化。所以应当注意不同时间和不同地区对数据发生的影响。
新的数字数据源的重要贡献是反映人们的观念、意图和愿望,但了解人们表达观念、意图和愿望的机理是困难的,而了解他们如何因地区和因语言、文化的不同而变化,并随时间而变化,也是同样困难的。很难在给定区域的两个不同的时间点之间或在给定时间点的二个不同区域之间建立一种因果关系。
上面涉及的是试图从某些类型数字数据源得到正确的推断或结论时所遇到的一些主要问题,虽然其中有些问题与新数字数据源存在特别的关联,但大多数问题在社会科学和政策制订中对于任何数据都是存在的。对此,最好的补救手段是依靠分析师,他们清楚地知道这些局限性,能够使基于数据做出的主张和决策在一个足够大的范围内适用。
(三)检测异常的相关问题
大数据的一个重要应用,是发现人类社会中将会发生什么样的异常问题,但为了测试或检测人类生态系统的异常,首先要定义什么是“异常”。也就是说,如果我们有了人类生态系统异常的定义,就可以通过测试来检测异常。问题是,我们如何合理的定义“异常”,或者说我们如何合理的假设什么情况属于“异常”。
由于人类生态系统的复杂性远远超过其他系统,对于什么样的情况是“正常”?什么样的情况是“异常”?往往是很难给出一个精准的定义。如果是一个普通的系统,例如一台机器、一个设备,我们可以通过加入一组已知的输入,然后测量它的输出,如果与预期的相同,就是正常的,否则就是出现了异常。但是对人类生态系统来说,即使是一个家庭、一个村庄或一个小区这样不大的生态系统,也很难对一组已知的输入,事先精确地确定一组预期的“输出”。
通常,通过与历史数据比较,与邻近地区数据比较等等,我们可以发现并判断一些异常,但这还远远不够,在表征和检测人类生态系统的异常方面还有许多研究要做。但是如果我们有了人类生态系统异常的定义,我们就可以通过测试来检测异常,与统计学的测试类似,即得出一种在概率意义上的正常或异常。
但是我们需要注意的是,与统计测试一样,检测结果都会包含一定的错误概率。在统计学中对于这种测试错误在一般情况下定义了两种类型:即“第一型错误”及“第二型错误” [32],其意义如下:
在假设检定中,会有一种称为零假设(H0)的假设。假设检定的目的就是利用统计的方式,推测零假设是否成立。若零假设事实上成立(为真),但统计检验的结果不支持零假设(拒绝零假设),这种错误称为第一型错误(假阳性)。若零假设事实上不成立(为假),但统计检验的结果未拒绝零假设,这种错误称为第二型错误(假阴性),上述情况如表4-1所示。
表4-1 零假设为真/假与测试结果的关系
测试情况 | 零假设(H0)为真 | 零假设(H0)为假 |
拒绝零假设(H0) | 第一型错误,假阳性 | 正确判断,真阳性 |
未拒绝零假设(H0) | 正确判断,真阴性 | 第二型错误,假阴性 |
对于一个特定的系统来说,如果减少第一型错误,第二型错误就会增大,反之,如果减少第二型错误,第一型错误就会增大。究竟哪一型错误的后果更严重,要看具体情况。例如,对检测某种危险疾病的系统而言,它的零假设是:人是健康的,那么,一般要求尽量减少第二型错误,即要使危险疾病被漏检的概率很小,这时,第一型错误会增大,即有较多的健康人会被误认为是患病了,但为了保障人身安全,这种代价是容许的(只要再重新检测往往就能纠正)。可是在另一种场合,例如对法院的判决来说,它的零假设是:被告是无辜的(无罪推定),那么,一般要求有充分的证据才能定罪,这就是要尽量减少第一型错误,即减少冤枉好人的可能性,这时,第二型错误会增加,即可能会较多地发生放过罪犯的情况。应当指出,如果将零假设反过来(例如“无罪推定”变成“有罪推定”),那么上面的讨论也要反过来才对。
在统计学中,系统的性能除了用第一型错误、第二性错误来描述外,也可以用特异性、敏感性来描述。例如,一个有较大第一型错误(假阳性)、较小第二型错误(假阴性)的系统,也就是一个有较低特异性、较高敏感性的系统;同样,一个有较小第一型错误(假阳性)、较大第二型错误(假阴性)的系统,也就是一个有较高特异性、较低敏感性的系统。
由于特异性、敏感性互相制约(即第一型错误和第二型错误互相制约),有人认为,与其精心平衡产生第一型错误和第二型错误的概率,不如减少产生第一型错误的概率。不过如前所述,在某些情况下,第二型错误的后果有可能比第一型错误的后果为更严重,这时,显然不能这样做。为了一般化起见,似乎还是应根据具体情况来确定两种错误的比重分配。
因此,为了得出合理的结论,并能对分析结果做出正确判断,把握大数据的语境非常重要。这意味着为了检测异常,不仅需要关心一个看起来异常的事实或趋势,而且需要关心多个异常的事实或趋势,这样才能更准确地检测异常或趋势。同时,要了解不同地区的语言和文化差异,不同地方的居民以不同的方式运用数字服务,他们对交流和通信也有不同的习惯准则。
另外,在大数据分析的所有阶段,都离不开分析师的作用。从选择分类到适当解释结果都是如此。首先也是最重要的是,要依靠信息的各种来源并以批判的眼光考察它们,这意味着要避免前面讲到的那些弊病。我们认为,虽然在依据群体来源数据进行决策时存在着风险和局限性,但这些数据仍是有价值的,只要它们是被“老练”的信息用户所利用。
应当指出,从数字数据源取得的实时信息不能代替政府决策时传统应用的定量统计证据,但是正确理解的话,它可以表明哪里需要做进一步的调查(在时间不太紧要的情况下),或者如果需要的话甚至可以立即做出响应(在灾难情况下,如飓风)从而改变结果,这是没有其他方法可以做到的。
遵守这些准则,用于发展的大数据可以满足它的最终目标:帮助政策制定者和发展实施者得到对弱势社区实践的丰富的、及时的洞察力,并实施更合适的、更敏捷的干预。
(四)隐私权与信息共享、安全保护等问题
大数据的获取、存储、保持、利用和展示,无一不涉及到隐私权问题,这包括法律上、技术上以及观念上的问题。如果这个问题不能很好地解决,大数据的发展将受到很大的制约,同时,个人或机构也可能会受到不必要的伤害。
按照ITU的定义,隐私权是“个人控制或影响关于他们自身的信息是否披露的权利”,这是个人层面上的隐私权。对于一个机构或组织来说,隐私权属于它们主权的范畴,是它们为了保护自己的安全、竞争力、知识产权和其他权利的需要。
随着因特网、移动因特网、云计算、大数据等新技术的发展,一些公司积累了并正在继续积累海量的用户信息,但如果没有适当的法律约束,这些信息可能会被滥用。例如过去匿名的信息可以被“非匿名化”,在未经本人许可的情况下被散布出去,对用户造成重大的危害。所以现在亟需制定保护隐私权的有关法规,使大数据等新技术的发展不至于造成损害民众利益的后果。
与隐私权相对的则是信息的利用和共享。我们既不希望大数据的发展损害用户的隐私权,也不希望以保护隐私权为名而妨碍信息的利用和共享,这两者应当兼顾,取得合理的平衡。对个人而言,不管他们提供信息时是自愿的或无意识的(后一种情况如用户在接受某项信息服务时往往会无意识地提供个人信息),我们都要尊重其隐私权,如果需要利用的话,应当进行“匿名化”处理(剥离一切个性信息)。另一方面,某些公司和机构不愿意其他机构(包括政府和一些公益机构)共享它们用户的数据以及它们自身的运营信息,虽然它们这样做可能是为了保护自身的安全、竞争力、知识产权等等,或是因为数据存储的地方和方式使其难于被利用和传送等等,但对整个国家或社会来说,这些信息不能共享是不利的。对此,应当通过法律、经济、技术和观念等等途径予以解决。例如,应当对共享数据的范围、方式、方法和如何授权等问题制定相应法规。除了可考虑经济补偿外,联合国Global Pulse行动计划正在推进“慈善数据”的概念,鼓励公司将把它们的数据集“匿名化”,并将它们提供给社会创新机构进行实时或近似实时的分析,以便挖掘其中的知识、模式和趋势。此外,技术上也要解决数据的互兼容性和系统的互操作性,以便于数据的共享。
邬贺铨院士将大数据的隐私与安全保护概括为法律、经济、技术和社会伦理四个方面[33]:
1.法律方面:承诺、数据收集的限制、数据使用的限制、开放性、责任性和数据拥有权;
2.经济方面:自调节机制、行为规范、隐私认证、商业利益和标准;
3.技术方面:安全加密的级别、密钥分配机理、能效的加密算法、可接入性认证、可信性认证、数据完整性认证、隐私增强技术和身份管理;
4.社会伦理方面:公众知情权、消费者权利、公开发布、消费者的主张和匿名机理。
三、大数据应用的实例
虽然我国在大数据方面刚起步不久,但目前各级领导都很重视通过网络了解民情,鉴于多数人只是刚接触到大数据,所以今后发展大数据技术及其应用还有很大的空间。
不久前国家信息中心网络政府研究中心课题组发表的《中国政府网站发展数据报告2012》是运用大数据指导我国政府网站工作的一个例子。通过对政府网站访问数据的分析,为改进政府网站,提高其服务水平指明了方向。
图4-8政府网站用户来源类型分析
来源:《中国政府网站发展数据报告2012》[34]
图4-8表明,政府网站用户来源首先是来自于搜索,其次是直接访问,第三位是网站导航。这就为如何扩大用户群提供了线索。
来源:《中国政府网站发展数据报告2012》[35]
图4-9表明政府网站用户需求分布情况,图4-9左边为对应不同关键词类别的点击率及其平均停留时间,右边为相应于移动终端用户的情况。显然,用户对公务公文词、政府机构词和办事服务词的需求量最大,这就为改进网站内容指明了方向。
上篇请看昨天刊登的《第一节 从商业智能到大数据》。
倪光南院士授权微信公众号【软件定义世界(SDX)】刊登,转载请注明来源。如果您需要《迎接大数据时代的来临》四节版电子版全文,请加我的个人微信号【sdxtime】索取。
如果您认为该文章不错,请转发至朋友圈。分享知识,分享快乐!
订阅“软件定义世界(SDX)”后,阅读更多精彩文章。“查看信息”中,回复【 】内数字快速到达。 ★《软件定义世界,数据驱动未来》(订阅人数S=4,一周阅读人数W=6681,转发率R(分享转发人数/图文页阅读人数)=10.27%,下同)【001】 ★《国务院副总理汪洋眼中的大数据》(S=349,W=16719,R=6.33%)【002】 ★《2013年世界软件产业发展回顾与展望》(S=223,W=1625,R=9.78%)【003】 ★《大数据(big data)正酣,小数据(iData)又来!》(S=481,W=8861,R=7.22%)【004】 ★《三张图让你看懂为何董明珠会输给雷军10亿元》(S=772,W=5304,R=5.32%)【005】 ★《平台格局确立,生态体系深化,竞争由硬转软--2013年全球移动互联网发展回顾与展望》(S=1539,W=685,R=13.36%)【006】 ★《德勤:大数据时代下的新商务战略》(S=3490,W=5021,R=8.52%)【007】 ▌软件定义世界(SDX) 软件定义世界(SDX),数据驱动未来(DDF)! 微信公众号:软件定义世界(SDX) |