大数据时代:生活、工作与思维的大变革
大数据(Big Data)指需要新处理模式才能具有更强的、洞察力和能力的海量、高增长率和多样化的信息资产。“大数据”概念最早由维克托·迈尔·舍恩伯格和肯尼斯·库克耶在编写中提出,指不用随机分析法(抽样调查)的捷径,而是采用所有数据进行分析处理。大数据有4V特点,即大量、高速、多样、价值。
“十三五”规划纲要中指出,实施国家大数据战略。把大数据作为基础性战略资源,全面实施促进大数据发展行动,加快推动数据资源共享开放和开发应用,助力产业转型升级和社会治理创新。这预示着一个新机遇的诞生。
作者
(英国)维克托•迈尔-舍恩伯格(ViktorMayer-Schönberger) (英国)肯尼斯•库克耶(KennethCukier)
作者简介
维克托•迈尔-舍恩伯格(Viktor Mayer-Schönberger),被誉为“大数据时代的预言家”,也是最受人尊敬的权威发言人之一。现任牛津大学网络学院互联网研究所治理与监管专业教授,曾任哈佛大学肯尼迪学院信息监管科研项目负责人,新加坡国立大学信息政策研究中心主任。一百多篇论文公开发表在《科学》《自然》等著名学术期刊上。
备受众多世界知名企业、机构和国家政府高层信赖的信息权威与智囊。他的咨询客户包括微软、惠普和IBM等全球顶级企业;他是欧盟互联网官方政策背后真正的制定者与参与者,也是世界经济论坛、马歇尔计划基金会等重要机构的咨询顾问;还先后担任新加坡商务部高层、文莱国防部高层、科威特商务部高层、迪拜及中东政府高层的咨询顾问。他所著的《删除》一书,获得美国政治科学协会颁发的“唐•K•普赖斯奖”,以及媒介环境学会颁发的“马歇尔•麦克卢汉奖”。
肯尼斯•库克耶(KennethCukier),《经济学人》数据编辑,曾任职于《华尔街日报》(亚洲版)和《国际先驱论坛报》。他是美国外交关系协会成员,CNN、BBC和NPR的定期商业和技术评论员之一。
译者
盛杨燕 周涛
译者简介
周涛,电子科技大学互联网科学中心主任、教授、博士生导师。发表SCI论文150余篇、领域一流期刊90余篇,SCI引用超过2600次,H指数26,Google引用超过6000次。第五届中国青少年科技创新奖和第十二届中国青年科技奖得主。
译著信息
出版社: 浙江人民出版社; 第1版 (2013年1月1日)
外文书名:
平 装: 261页
语 种: 简体中文
开 本: 16
ISBN : 9787213052545,7213052543
编辑推荐(摘录)
宽带资本董事长田溯宁,微软全球资深副总裁、微软亚太研发集团主席张亚勤,中国互联网发展重要参与者、知名IT评论人谢文,北京云基地首席顾问、云华时代智能科技有限公司董事长郭昕,上海交通大学长江学者特聘教授、致远学院常务副院长汪小帆,中国传媒大学教授沈浩,清华大学计算机科学与技术系副主任、教授陈文光,中国社科院信息化研究中心秘书长、《互联网周刊》主编姜奇平,《财经》杂志执行主编、《哈佛商业评论》中文版主编何刚、微软亚洲研究院主管研究员谢幸等重磅推荐。
大数据将为人类的生活创造前所未有的可量化的维度。大数据已经成为了新发明和新服务的源泉,而更多的改变正蓄势待发。书中展示了谷歌、微软、亚马逊、IBM、苹果、facebook、twitter、VISA等大数据先锋们具有价值的应用案例。
名人推荐
维克托•迈尔-舍恩伯格教授这本《大数据时代》,是我看到的最好的大数据著作,不仅对于产业实践者,还是对于政府和公众机构,都是非常具有价值的。只要我们以开放的心态、创新的勇气拥抱“大数据时代”,就一定会抓住历史赋予中国创新的机会。——田溯宁 宽带资本董事长
正如迈尔-舍恩伯格教授认为的,大数据要求人们改变对精确性的苛求,转而追求混杂性;要求人们改变对因果关系的追问,转而追求相关关系。这种思维的转变将是革命性的,如果企业不能认识到这一思维方式转变的重要性和迫切性,将会面临 “数据鸿沟”的挑战。 ——张亚勤微软全球资深副总裁,微软亚太研发集团主席
过去几年,在大数据方面我读过十几本书、上百篇论文和文章。相对而言,维克托的《大数据时代》是迄今为止我读过的最好的一本专著,中英文都算上。——谢文 中国互联网发展的重要参与者,知名IT评论人
大数据正把我们变成新的物种。首先,大数据改变了我们的思维方式,让我们从因果关系的串联思维变成了相关关系的并联思维。第二,大数据改变了我们的生产方式,物质产品的生产退居次位,信息产品的加工将成为主要的生产活动。第三,大数据改变了我们的生活方式,我们的精神世界和物质世界都将构建在大数据之上。大数据不仅仅是一门技术,更是一种全新的商业模式,它与云计算共同构成了下一代经济的生态系统。一切皆信息。——郭昕 北京云基地首席顾问,云华时代智能科技有限公司董事长
随着大数据热潮的不断升温,相信今后几年会有更多以大数据为主题的著作问世。这本先河之作用各种案例生动阐述了大数据所带来的变革。你可以不同意书中的某些观点,但是大数据所带来的变革已经开始发生并将继续深入。我们需要共同面临的挑战是:越来越大的数据如何才能让世界变得越来越美丽?——汪小帆 上海交通大学长江学者特聘教授,致远学院常务副院长
我们生活在社会中,就不得不同数据打交道。我们也是数据的一部分,不论我们想不想与大数据牵扯到一起,数据都会找到我们,覆盖我们。大数据时代已经来临,如何从海量数据中发现知识,寻找隐藏在大数据中的模式、趋势和相关性,揭示社会现象与社会发展规律,以及可能的商业应用前景,都需要我们拥有更好的数据洞察力。——沈浩 中国传媒大学教授
大数据无疑是当前的热门话题,对产业界、学术界和教育界都正在产生巨大的影响。然而到底什么是大数据,大数据到底和过去的数据分析技术有何联系和不同?这又是一个各执一词的问题。本书的角度非常独特而深入,提出了“不是随机样本,而是所有数据”“不是精确性,而是混杂性”“不是因果关系,而是相关关系”这样三个关于大数据的鲜明观点,并引用很多例子加以说明,非常值得仔细研读和思考。——陈文光 清华大学计算机科学与技术系副主任、教授
维克托认为大数据将使人们从对因果关系的渴求转向关注相关关系,这是对人类关系结构变革的深刻洞察。因果关系通向金字塔的建立,相关关系通向扁平化的实现。大数据由此将带来对人的重新认识,不是在阿波罗神庙,而是在小世界网络中“认识你自己”。——姜奇平中国社科院信息化研究中心秘书长,《互联网周刊》主编
大数据时代已经来临,先知、先觉、先行和先试者既可能率先受益,也可能率先迷失,关键在于能否看清创新方向并找到应用模式。《大数据时代》这本书最突出的价值,就在于其对商业实践的跟踪与建议。即使作者的一些预见在未来也许会落空,其大胆探索大数据商业应用的努力,仍然值得鼓励。——何刚 《财经》杂志执行主编,《哈佛商业评论》中文版主编
在人们还在沉浸于讨论多大规模的数据才是“大数据”的时候,《大数据时代》这本书就“大数据时代”将对人类社会带来的革命性影响进行了深刻的分析。正如书中所述,“大数据”的本质是思维、商业和管理领域前所未有的大变革。领衔翻译本书的周涛教授是国内大数据和网络科学领域的青年领军人物,相信对不同层次的读者都会裨益匪浅。——谢幸 微软亚洲研究院主管研究员
推荐序一
拥抱“大数据时代”
宽带资本董事长 田溯宁
从硅谷到北京,大数据的话题正在被传播。随着智能手机以及“可佩带”计算设备的出现,我们的行为、位置,甚至身体生理数据等每一点变化都成为了可被记录和分析的数据。以此为基础,“反馈经济”(feedbackeconomy)等新经济、新商业模式也正在开始形成。维克托•迈尔-舍恩伯格教授这本《大数据时代》,是我看到的最好的大数据著作,不管对于产业实践者,还是对于政府和公众机构,都是非常具有价值的。
如今,一个大规模生产、分享和应用数据的时代正在开启。正如维克托教授所说,大数据的真实价值就像漂浮在海洋中的冰山,第一眼只能看到冰山的一角,绝大部分都隐藏在表面之下。而发掘数据价值、征服数据海洋的“动力”就是云计算。互联网时代,尤其是社交网络、电子商务与移动通信把人类社会带入了一个以“PB”(1024TB)为单位的结构与非结构数据信息的新时代。在云计算出现之前,传统的计算机是无法处理如此量大、并且不规则的“非结构数据”的。
以云计算为基础的信息存储、分享和挖掘手段,可以便宜、有效地将这些大量、高速、多变化的终端数据存储下来,并随时进行分析与计算。大数据与云计算是一个问题的两面:一个是问题,一个是解决问题的方法。通过云计算对大数据进行分析、预测,会使得决策更为精准,释放出更多数据的隐藏价值。数据,这个21世纪人类探索的新边疆,正在被云计算发现、征服。
《大数据时代》列举了众多在公共卫生、商业服务领域大数据变革的例子。一旦“不再追求精确度,不再追求因果关系,而是承认混杂性,探索相关关系”,“思维转变过来,数据就能被巧妙地用来激发新产品和新型服务”。数据正成为巨大的经济资产,成为新世纪的矿产与石油,将带来全新的创业方向、商业模式和投资机会。
庞大的人群和应用市场,复杂性高、充满变化,使得中国成为世界上最复杂的大数据国家。解决这种由大规模数据引发的问题,探索以大数据为基础的解决方案,是中国产业升级、效率提高的重要手段。数据挖掘不仅能够成为公司竞争力的来源,也将成为国家竞争力的一部分。联系到我国现代化所面临的种种问题以及教育、交通、医疗保健等各方面挑战,通过大数据这种创新方式来解决问题,创建新的产业群,实现“中国制造到中国创造”的改变,意义就更大。
“大数据”发展的障碍,在于数据的“流动性”和“可获取性”。美国政府创建了Data.gov网站,为大数据敞开了大门;英国、印度也有“数据公开”运动。中国要赶上这样一场大数据变革,各界应该首先开始尝试公开数据、方式与方法。如同工业革命要开放物质交易、流通一样,开放、流通的数据是时代趋势的要求。《大数据时代》一书也提到了数据拥有权、隐私性保护等问题,但相比较来看,新科技可能带来的改变要远远大于其存在的问题。
本书的译者周涛教授是我国最年轻有为的大数据专家。这位27岁的天才型教授,数年来一直带领我国学术界在大数据研究上向国际一流看齐。更可贵的是,他不仅做研究,也关注着研究成果的商业化及传播。这部译著就是他这种努力的一个成果。
现代历史上的历次技术革命,中国均是学习者。而在这次云计算与大数据的新变革中,中国与世界的距离最小,在很多领域甚至还有着创新与领先的可能。只要我们以开放的心态、创新的勇气拥抱“大数据时代”,就一定会抓住历史赋予中国创新的机会。
推荐序二
实实在在大数据
中国互联网发展的重要参与者,知名IT评论人 谢文
因为我本身十分关注大数据,也写过若干关于大数据的文章,做过若干关于大数据的演讲,所以对有关这一主题的论文和书籍非常有兴趣。过去几年,在这方面我读过十几本书、上百篇论文和文章。相对而言,维克托•迈尔-舍恩伯格教授的《大数据时代》是迄今为止我读过的最好的一本专著,中英文都算上。
此书的一大贡献就是在大数据方兴未艾、众说纷纭的时刻,进一步阐述和厘清了大数据的基本概念和特点,这对许多以为大数据就是“数据大”的人来说很有帮助。
在人类历史长河中,即使是在现代社会日新月异的发展中,人们还主要是依赖抽样数据、局部数据和片面数据,甚至在无法获得实证数据的时候纯粹依赖经验、理论、假设和价值观去发现未知领域的规律。因此,人们对世界的认识往往是表面的、肤浅的、简单的、扭曲的或者是无知的。维克托指出,大数据时代的来临使人类第一次有机会和条件,在非常多的领域和非常深入的层次获得和使用全面数据、完整数据和系统数据,深入探索现实世界的规律,获取过去不可能获取的知识,得到过去无法企及的商机。
大数据的出现,使得通过数据分析获得知识、商机和社会服务的能力从以往局限于少数象牙塔之中的学术精英圈子扩大到了普通的机构、企业和政府部门。门槛的降低直接导致了数据的容错率提高和成本的降低,但正如维克托所强调的,最重要的是人们可以在很大程度上从对于因果关系的追求中解脱出来,转而将注意力放在相关关系的发现和使用上。只要发现了两个现象之间存在的显著相关性,就可以创造巨大的经济或社会效益,而弄清二者为什么相关可以留待学者们慢慢研究。大数据之所以可能成为一个“时代”,在很大程度上是因为这是一个可以由社会各界广泛参与,八面出击,处处结果的社会运动,而不仅仅是少数专家学者的研究对象。
大数据将逐渐成为现代社会基础设施的一部分,就像公路、铁路、港口、水电和通信网络一样不可或缺。但就其价值特性而言,大数据却和这些物理化的基础设施不同,不会因为人们的使用而折旧和贬值。例如,一组DNA可能会死亡或毁灭,但数据化的DNA却会永存。所以,维克托赞同许多物理学家的看法,世界的本质就是数据。因此,大数据时代的经济学、政治学、社会学和许多科学门类都会发生巨大甚至是本质上的变化和发展,进而影响人类的价值体系、知识体系和生活方式。哲学史上争论不休的世界可知论和不可知论将会转变为实证科学中的具体问题。可知性是绝对的,无事无物不可知;不可知性是相对的,是尚未知道的意思。
对于不从事网络业、IT业以及数据分析和使用的读者,本书的一大好处就是通俗易懂,通过具体实例说明问题,有助于人们的理解和联想。在时限上,作者概括了直到2012年7月大数据方向上的最新发展,避免了许多同类作品存在的例证过于陈旧、视野相对狭窄的毛病。
作为一位生活在欧美现代社会的学者,维克托是把民主、开放和理性作为已知前提来讨论大数据革命的。这对生活在发展中国家,社会现代化程度尚且有限的读者来说,也许是个遗憾,因为书中描述的许多已经发生的事例可能更像是神话。没有市场经济制度和法治体系作为基础支撑,大数据很可能成为发达国家在下一轮全球化竞争中的利器,而发展中国家依然处于被动依附的状态之中。整个世界可能被割裂为大数据时代、小数据时代和无数据时代。
处于发展中国家前列的中国,目前正面临着一个重大的历史抉择关口。应该说,在过去的三十余年时间里,中国在快速走向工业化、信息化、网络化方面交出了一份不错的成绩单。如今适逢世界走向数据化,迈入大数据时代的时刻,无论对个人、企业还是对社会和国家,都有认真理解、严肃决策的必要性和紧迫性。哪怕仅从这一点考虑,读一读这本书也是很值得的。
译者序
在路上•晃晃悠悠
电子科技大学教授,互联网科学中心主任 周涛
接下翻译这本《大数据时代》的任务时,我的目标是做到110%的好。因为作者维克托•迈尔-舍恩伯格毕竟不像我们每天在一线与数据厮杀搏斗,其爱其恨都更深刻。特别地,我们可以为中文的读者补充很多中国的例子和参考资料。很遗憾,我们最终只做到了90%,应该补充的一些材料还没有整理好,遣词造句也多有生硬疏忽之处。如果再给我一个月的时间,就可以达到我预想的110%甚至120%。
为什么现在把这个版本呈现给诸位呢?一是因为我们的努力使得本书中译本的出版和英文原版完全同步,单从获取知识的角度讲,我们一点儿不比美国的读者慢!二是我相信作者在书中的一个重要观点,就是大数据时代,要允许一点点的错误和不完美,因为效率可能更加重要!留下一些可供提高的地方,也使得我们的每一次印刷,都能够与以前有所不同。亲,这不是建议你等到某个更好的版本才去购买,而是说,其实你应该每个版本都买一本)。
《大数据时代》这本书是200%的好,因此90%的译本也绝对值得一读。首先,作者抛出了大数据时代处理数据理念上的三大转变:要全体不要抽样,要效率不要绝对精确,要相关不要因果;接着,从万事万物数据化和数据交叉复用的巨大价值两个方面,讲述驱动大数据战车在材质和智力方面向前滚动的最根本动力;最后,作者冷静描绘了大数据帝国前夜的脆弱和不安,包括产业生态环境、数据安全隐私、信息公正公开等问题。
国内最近也出版了一些大数据方面的著作,可以和本书互为补充。郑毅的《证析》对于数据通过交叉复用体现的新价值、大数据战略在企业与政府执行层面的流程和大数据科学家这一新职位,以及围绕这个职位的能力和责任给出了最深刻、最具体的描述;子沛的《大数据》对于数据的公正性、公平性以及信息和数据管理等方面理念、政策和执行的变化,特别是美国在这方面的进展,给出了完整的介绍;苏萌、林森和我合著的《个性化:商业的未来》则对大数据时代最重要的技术、个性化技术,以及与之相关的新商业模式给出了从理念到技术细节的全景工笔。总的来说,这三本书都针对本书的某一局部给出了更深刻的介绍和洞见,也各有明显超出本书的优点,但三本之和也无法囊括本书的菁华,亦缺乏本书的宏大视野。
简单地说,这本书好在三个地方:一是观点掷地有声,绝非主流媒体上若干讨论的简单汇总和平均,更不是一个宏大概念面前暧昧的叫好声。读者可能对其中一些观点并不认同,但是读完之后不可能一个都记不住。二是观念高屋建瓴,作者试图从很多实例和经验,包括历史事件中萃取出普适性的观念,而不仅仅是适用于几个特定情况的案例分析。三是例子丰富翔实,不大的篇幅包括了上百个学术和商业的实例。三点近乎完美地结合起来,体现了作者驾驭大问题的能力和丰富的知识,以及,可能更为重要地,作者渴求立言立说的野心!所以说,这本书绝对不是一堆枯燥的纲要,更不是一本巨厚的杂志。
我在这里拼命叫好,是为了这本书卖得更多,但不代表作者的所有观点都是绝对真理。举个例子,我本人对于大数据时代“相关关系比因果关系更重要”这个观点就不认同。有了机器学习,特别是集成学习,我们解决问题的方式变成了训练所有可能的模型和拟合所有可能的参数——问题从一个端口进去,答案从另一个端口出来,中间则是一个黑匣子,因为没有人能够从成千上万的参数拟合值里面读到“科学”,我们读到的只是“计算机工程”。与其说大数据让我们重视相关胜于因果,不如说机器学习和以结果为导向的研究思路让我们变成这样。
那么,大数据是不是都这样了?其实很多时候恰恰相反。想想瑞士日内瓦的强子对撞机,我们在上面捕获了人类有史以来最大规模的单位时间数据。我们是希望找到或者验证某种相关关系吗?不是!我们试图回答的,正是人类所能问出的关于因果关系最伟大的问题:希格斯玻色子是否存在,我们的宇宙是否有可能用标准模型刻画。这个问题的最终答案,将打破人和神的界限!认为相关重于因果,是某些有代表性的大数据分析手段(譬如机器学习)里面内禀的实用主义的魅影,绝非大数据自身的诉求。从小处讲,作者试图避免的“数据的独裁”和“错误的前提导致错误的结论”,其解决之道恰在于挖掘因果逻辑而非相关性;从大处讲,放弃对因果性的追求,就是放弃了人类凌驾于计算机之上的智力优势,是人类自身的放纵和堕落。如果未来某一天机器和计算完全接管了这个世界,那么这种放弃就是末日之始。苏珊•朗格(Susan Langer)在《哲学新视野》一书中说:
“某些观念有时会以惊人的力量给知识状况带来巨大的冲击。由于这些观念能一下子解决许多问题,所以,它们似乎将有希望解决所有基本问题,澄清所有不明了的疑点。每个人都想迅速地抓住它们,作为进入某种新实证科学的法宝,作为可以用来建构一个综合分析体系的概念轴心。这种‘宏大概念’突然流行起来,一时间把几乎所有的东西都挤到了一边。”
这段话通常被认为是对当时“存在主义”和“精神分析法”这类万能概念的善意批评,而如今特别适合作为一盆冷水泼在那些没有任何深刻理解,却月月日日分分秒秒穿行于各种“大数据嘉年华”的投资人、媒体人和创业者身上。希望《大数据时代》给予各位的是一些实实在在的知识和思考,并且唤起各位安静思索相关问题的心境。大数据是一个很重要的概念,代表了很重要的趋势,但我不希望它成为一种放之四海皆准的万能概念——因为越是万能的,就越是空洞的!人类学家克利福德•吉尔兹(Clifford Geertz)在其著作《文化的解释》中曾给出了一个朴素而冷静的劝说:“努力在可以应用、可以拓展的地方,应用它、拓展它;在不能应用、不能拓展的地方,就停下来。”我想,这应该是所有人面对一个新领域或新概念时应有的态度。
大数据的道路上没有戈多,我们已经在路上,晃晃悠悠。人类的自由意志和诸神之下的尊严,会在这条道路上异化甚至消逝吗?极目远眺,不知道世界的尽头,是否是一个冷酷的仙境!诸位为之奋斗吧,而我只想,做一个,麦田里的守望者。
文摘
大数据,变革商业
大数据不仅改变了公共卫生领域,整个商业领域都因为大数据而重新洗牌。购买飞机票就是一个很好的例子。
2003年,奥伦•埃齐奥尼(Oren Etzioni)准备乘坐从西雅图到洛杉矶的飞机去参加弟弟的婚礼。他知道飞机票越早预订越便宜,于是他在这个大喜日子来临之前的几个月,就在网上预订了一张去洛杉矶的机票。在飞机上,埃齐奥尼好奇地问邻座的乘客花了多少钱购买机票。当得知虽然那个人的机票比他买得更晚,但是票价却比他便宜得多时,他感到非常气愤。于是,他又询问了另外几个乘客,结果发现大家买的票居然都比他的便宜。对大多数人来说,这种被敲竹杠的感觉也许会随着他们走下飞机而消失。然而,埃齐奥尼是美国最有名的计算机专家之一,从他担任华盛顿大学人工智能项目的负责人开始,他创立了许多在今天看来非常典型的大数据公司,而那时候还没有人提出“大数据”这个概念。
1994年,埃齐奥尼帮助创建了最早的互联网搜索引擎MetaCrawler,该引擎后来被InfoSpace公司收购。他联合创立了第一个大型比价网站Netbot,后来把它卖给了Excite公司。他创立的从文本中挖掘信息的公司ClearForest则被路透社收购了。在他眼中,世界就是一系列的大数据问题,而且他认为他有能力解决这些问题。作为哈佛大学首届计算机科学专业的本科毕业生,自1986年毕业以来,他也一直致力于解决这些问题。
飞机着陆之后,埃齐奥尼下定决心要帮助人们开发一个系统,用来推测当前网页上的机票价格是否合理。作为一种商品,同一架飞机上每个座位的价格本来不应该有差别。但实际上,价格却千差万别,其中缘由只有航空公司自己清楚。
埃齐奥尼表示,他不需要去解开机票价格差异的奥秘。他要做的仅仅是预测当前的机票价格在未来一段时间内会上涨还是下降。这个想法是可行的,但操作起来并不是那么简单。这个系统需要分析所有特定航线机票的销售价格并确定票价与提前购买天数的关系。
如果一张机票的平均价格呈下降趋势,系统就会帮助用户做出稍后再购票的明智选择。反过来,如果一张机票的平均价格呈上涨趋势,系统就会提醒用户立刻购买该机票。换言之,这是埃齐奥尼针对9000米高空开发的一个加强版的信息预测系统。这确实是一个浩大的计算机科学项目。不过,这个项目是可行的。于是,埃齐奥尼开始着手启动这个项目。埃齐奥尼创立了一个预测系统,它帮助虚拟的乘客节省了很多钱。这个预测系统建立在41天内价格波动产生的12000个价格样本基础之上,而这些信息都是从一个旅游网站上搜集来的。这个预测系统并不能说明原因,只能推测会发生什么。也就是说,它不知道是哪些因素导致了机票价格的波动。机票降价是因为很多没卖掉的座位、季节性原因,还是所谓的周六晚上不出门,它都不知道。这个系统只知道利用其他航班的数据来预测未来机票价格的走势。“买还是不买,这是一个问题。”埃齐奥尼沉思着。他给这个研究项目取了一个非常贴切的名字,叫“哈姆雷特”。
这个小项目逐渐发展成为一家得到了风险投资基金支持的科技创业公司,名为Farecast。通过预测机票价格的走势以及增降幅度,Farecast票价预测工具能帮助消费者抓住最佳购买时机,而在此之前还没有其他网站能让消费者获得这些信息。
这个系统为了保障自身的透明度,会把对机票价格走势预测的可信度标示出来,供消费者参考。系统的运转需要海量数据的支持。为了提高预测的准确性,埃齐奥尼找到了一个行业机票预订数据库。有了这个数据库,系统进行预测时,预测的结果就可以基于美国商业航空产业中,每一条航线上每一架飞机内的每一个座位一年内的综合票价记录而得出。如今,Farecast已经拥有惊人的约2000亿条飞行数据记录。利用这种方法,Farecast为消费者节省了一大笔钱。
棕色的头发,露齿的笑容,无邪的面孔,这就是奥伦•埃齐奥尼。他看上去完全不像是一个会让航空业损失数百万潜在收入的人。但事实上,他的目光放得更长远。2008年,埃齐奥尼计划将这项技术应用到其他领域,比如宾馆预订、二手车购买等。只要这些领域内的产品差异不大,同时存在大幅度的价格差和大量可运用的数据,就都可以应用这项技术。但是在他实现计划之前,微软公司找上了他并以1.1亿美元的价格收购了Farecast公司。而后,这个系统被并入必应搜索引擎。
到2012年为止,Farecast系统用了将近十万亿条价格记录来帮助预测美国国内航班的票价。Farecast票价预测的准确度已经高达75%,使用Farecast票价预测工具购买机票的旅客,平均每张机票可节省50美元。
Farecast是大数据公司的一个缩影,也代表了当今世界发展的趋势。五年或者十年之前,奥伦•埃齐奥尼是无法成立这样的公司的。他说:“这是不可能的。”那时候他所需要的计算机处理能力和存储能力太昂贵了!虽说技术上的突破是这一切得以发生的主要原因,但也有一些细微而重要的改变正在发生,特别是人们关于如何使用数据的理念。
目录
推荐序一拥抱“大数据时代”
宽带资本董事长田溯宁
推荐序二实实在在大数据
中国互联网发展的重要参与者,知名IT评论人谢文
译者序在路上·晃晃悠悠
电子科技大学教授,互联网科学中心主任周涛
引言一场生活、工作与思维的大变革
大数据,变革公共卫生
大数据,变革商业
大数据,变革思维
大数据,开启重大的时代转型
预测,大数据的核心
大数据,大挑战
第一部分大数据时代的思维变革
第1章更多:不是随机样本,而是全体数据
让数据“发声”
小数据时代的随机采样,最少的数据获得最多的信息
全数据模式,样本=总体
第2章更杂:不是精确性,而是混杂性
允许不精确
大数据的简单算法比小数据的复杂算法更有效
纷繁的数据越多越好
混杂性,不是竭力避免,而是标准途径
新的数据库设计的诞生
第3章更好:不是因果关系,而是相关关系
关联物,预测的关键
“是什么”,而不是“为什么”
改变,从操作方式开始
大数据,改变人类探索世界的方法
第二部分大数据时代的商业变革
第4章数据化:一切皆可“量化”
数据,从最不可能的地方提取出来
数据化,不是数字化
量化一切,数据化的核心
当文字变成数据
当方位变成数据
当沟通成为数据
一切事物的数据化
第5章价值:“取之不尽,用之不竭”的数据创新
数据创新1:数据的再利用
数据创新2:重组数据
数据创新3:可扩展数据
数据创新4:数据的折旧值
数据创新5:数据废气
数据创新6:开放数据
给数据估值
第6章角色定位:数据、技术与思维的三足鼎立
大数据价值链的3大构成
大数据掌控公司
大数据技术公司
大数据思维公司和个人
全新的数据中间商
专家的消亡与数据科学家的崛起
大数据,决定企业的竞争力
第三部分大数据时代的管理变革
第7章风险:让数据主宰一切的隐忧
无处不在的“第三只眼”
我们的隐私被二次利用了
预测与惩罚,不是因为所做,而是因为“将做”
数据独裁
挣脱大数据的困境
第8章掌控:责任与自由并举的信息管理
管理变革1:个人隐私保护,从个人许可到让数据使用者承担责任
管理变革2:个人动因VS预测分析
管理变革3:击碎黑盒子,大数据程序员的崛起
管理变革4:反数据垄断大亨
结语 正在发生的未来
【好书推荐】仔细甄选的有益读物。