公司利用大数据的三大模式
导读:根据所提供价值的不同来源,分别出现了三种大数据公司。这三种来源是指:数据本身、 技能与思维。出现的三种大数据公司分别是基于数据本身的公司、基于技能的公司、基于思维的公司。
全文4264字,建议阅读时间5分钟。
第一种是基于数据本身的公司。这些公司拥有大量数据或者至少可以收集到大量数据,却不一定有从数据中提取价值或者用数据催生创新思想的技能。最好的例子就是Twitter ,它拥有海量数据这一点是毫无疑问的,但是它的数据都通过两个独立的公司授权给别人使用。
第二种是基于技能的公司。它们通常是咨询公司、技术供应商或者分析公司。它们掌握了专业技能但并不一定拥有数据或提出数据创新性用途的才能。比方说,沃尔玛和Pop-Tarts这两个零售商就是借助天睿公司的分析来获得营销点子,天睿就是一家大数据分析公司。
第三种是基于思维的公司。皮特·华登 ,Jetpac 的联合创始人,就是通过想法获得价值的一个例子。Jetpac通过用户分享到网上的旅行照片来为人们推荐下次旅行的目的地。对于某些公司来说,数据和技能并不是成功的关键。让这些公司脱颖而出的是其创始人和 员工的创新思维,他们有怎样挖掘数据的新价值的独特想法。
到目前为止,前两种因素一直备受关注,因为在现今世界,技能依然欠缺,而数据则非常之多。近年来,一种新的职业出现了,那就是“数据科学家” 。数据科学家是统计学家、软件程序员、图形设计师与作家的结合体。与通过显微镜发现事物不同,数据科学家通过探寻数据库来得到新的发现。全球知名咨询管理公司麦肯锡,就曾极端地预测数据科学家是当今和未来稀缺的资源。如今的数据科学家们也喜欢用这个预测来提升自己的地位和工资水平。
同时,谷歌的首席经济学家哈尔·范里安 (Hal Varian )认为统计学家是世界上最棒的职业, 他的这种说法非常著名。“如果你想成功,你不应该成为一个普通的、可被随意替代的人,你应 该成为稀缺的、不可替代的那类人,”他还说,“数据非常之多而且具有战略重要性,但是真正 缺少的是从数据中提取价值的能力。这也就是为什么统计学家、数据库管理者和掌握机器理论 的人是真正了不起的人。” 但是,过分强调技术和技能而忽视数据本身的重要性也是不可取的。随着计算机行业的发 展,人力技术的落后会被慢慢地克服,而范里安所赞赏的技能将会变成十分普通的事情。认为 当今世界数据非常之多,所以收集数据很简单而且数据价值并不高的想法是绝对错误的——数据才是最核心的部分。要知道原因,就必须考虑到大数据价值链的各个部分,以及它们会如何发展变化。
大数据掌控公司
大数据最值钱的部分就是它自身,所以最先考虑数据拥有者才是明智的。他们可能不是第 一手收集数据的人,但是他们能接触到数据、有权使用数据或者将数据授权给渴望挖掘数据价值的人。
有的公司精明地把自己放在了这个信息链的核心,这样它们就能扩大规模、挖掘数据的价值。信用卡行业的情况就符合这一点。多年来,防范信用诈骗的高成本使得许多中小银行都不 愿意发行自己的信用卡;而是由大型金融机构发行,因为只有它们才能大规模地投入人力物力 发展防范技术。美国第一资本银行和美国银行这样的大型金融机构就承担了这个工作。但是现 在小银行后悔了,因为没有自己发行的信用卡,它们就无从得知客户的消费模式,从而不能为 客户提供定制化服务。
处于这个数据链的中心,MasterCard 占据了收集数据和挖掘数据价值的黄金位置。我们可以想象,未来的信用卡公司不会再对交易收取佣金,而是免费提供支付服务。作为回报,它们会获得更多的数据,而对这些数据进行复杂的分析之后,它们又可以卖掉分析结果以取得利润。
大数据技术公司
第二种类型就是拥有技术和专业技能的公司。MasterCard选择了自己分析,有的公司选择在 两个类型之间游移,但是还有一部分公司会选择发展专业技能。比方说,埃森哲咨询公司就与 各行各业的公司合作应用高级无线感应技术来收集数据,然后对这些数据进行分析。
在医学数据领域,我们可以看到一个关于技术公司如何能提供有效服务的很好的例子。位 于华盛顿州的华盛顿中心医院与微软研究中心合作分析了多年来的匿名医疗记录,涉及患者人 口统计资料、检查、诊断、治疗资料,等等。这项研究是为了减少感染率和再入院率,因为这 两项所耗费的费用是医疗卫生领域最大的一部分,所以任何可以减少哪怕是很小比例的方法都 意味着节省巨大的开支。
这项研究发现了很多惊人的相关关系:在一系列情况下,一个出院了的病人会在一个月之 内再次入院。有一些情况是众所周知但还没有找到好的解决办法的,比方说,一个患充血性心 力衰竭的病人就很有可能再次入院,因为这是非常难医治的病。但是研究也发现了一个出人意 料的重要因素,那就是病人的心理状况。如果对病人最初的诊断中有类似“压抑”这种暗示心理 疾病的词的话,病人再度入院的可能性大很多。 虽然这种相关关系对于建立特定的因果关系并无帮助,但是这表明,如果病人出院之后的 医学干预是以解决病人的心理问题为重心,可能会更有利于他们的身体健康。这样就可以提供 更好的健康服务,降低再入院率和医疗成本。这个相关关系是机器从一大堆数据中筛选出来 的,也是人类可能永远都发现不了的。微软不控制数据,这些数据只属于医院;微软没有出彩 的想法,那并不是这里需要的东西,相反,微软只是提供了分析工具,也就是Amalga系统来帮 助发现有价值的信息。
大数据拥有者依靠技术专家来挖掘数据的价值。但是,虽然受到了高度的赞扬,而且同时 拥有“数据武士”这样时髦的名字,但技术专家并没有想象中那么耀眼。他们在大数据中淘金, 发现了金银珠宝,可是最后却要把这些财富拱手让给大数据拥有者。珠宝,可是最后却要把这些财富拱手让给大数据拥有者。
大数据思维公司和个人
第三种类型是有着大数据思维的公司和个人。他们的优势在于,他们能先人一步发现机 遇,尽管本身并不拥有数据也不具备专业技能。事实上,很可能正因为他们是外行人,不具备这些特点,他们的思维才能不受限制。他们思思考的只有可能,而不考虑所谓的行。
因为有着大数据思维,克罗斯和他的FlightCaster是第一个行动起来的,但也没比别人快多 少。所所谓谓大数据思维,是指一种意识,认为公开的数据一旦处理得当就能为千百万人急需解决的问题提供答案。2009年8月,FlightCaster 公开发布了。同一个月,FlyOnTime.us 的计算机 专家们也开始搜刮公开的数据建立他们的网站。最终,FlightCaster 的优势慢慢地减弱了。2011 年1月,克罗斯和他的同伴把网站卖给了Next Jump ,这是一个使用大数据技术进行企业折扣管理 的公司。之后,克罗斯把他的目光转向了另外一个夕阳行业——新闻行业。他发现,这里是一个创 新型的外行人可以大有作为的宝地。他的科技创新公司Prismatic收集网上资源并排序,这种排序 建立在文本分析、用户喜好、社交网络普及和大数据分析的基础之上。重要的是,这个系统并 不介意这是一个青少年的博客、一个企业网站还是 《华盛顿邮报》上的一篇报道,只要它的内 容相关并且很受欢迎就能排在很靠前的位置。而关于是否受欢迎,是通过它的点击率和分享次 数来体现的。
作为一项服务,Prismatic关注的是年青一代与媒体进行交流的新方法,信息的来源并不重 要。同时,这也给那些自视过高的主流媒体提了一个醒:公众的力量要远远超过它们,而西装 革履的记者们也需要与一群不修边幅的博主进行竞争。也许最令人无法想象的是,Prismatic居然 是从新闻领域内部诞生出来的,虽然它确实收集了大量的数据。美国国家记者俱乐部 的常客从来没有想过要再利用网上的媒体资源,阿蒙克、纽约和印度班加罗尔的分析专家们也没有想过要用这种方法来使用数据。克罗斯顶着一头蓬松的头发,说话吞吞吐吐, 可就是这样一个不起眼的外行人,想到了也做到了,他使用这些数据来告诉世界什么是比 《纽 约时报》更有用的信息来源。
大数据思维这个概念以及一个拥有创新思维的人的地位,与20世纪90年代电子商务初期出 现的情况是不一样的。电子商务先驱者们的思想没有被传统行业的固有思维和制度缺陷所限制,因此,在对冲基金工作的金融工程师杰夫·贝索斯创建了网上书店亚马逊而不是巴诺书店 ; 软件开发工程师皮埃尔·奥米迪亚开发了一个拍卖网站而不是苏富比。如今,拥有大数据思维的领导者通常自己并不拥有数据资源。但就是因为这 样,他们不会受既得利益和金钱欲望这样的因素影响而阻碍自己的想法实践。
就像我们看到的,也有公司集合了大数据的多数特点。埃齐奥尼和克罗斯不仅比别人早一 步有了这些决胜的思想,他们也有技术优势。Teradata和埃森哲的员工不仅规规矩矩地打卡上 班,还时不时会有些机灵的点子。这些原型都有助于我们认识不同公司所承担的角色。我们在上一章节中提到的手机公司掌握了海量的数据却不知道该如何使用,然而,它们可以把这些数据授权给有能力挖掘出数据价值的人。同样地,Twitter一早就决定把它所掌握的海量数据授权 给了两家公司。如今的大数据先驱者们通常都有着交叉学科背景,他们会将这些知识与自己所 掌握的数据技术相结合,应用于广泛的领域之中。新一代的天使投资人和企业家正在诞生,他 们主要是来自谷歌已经离职的员工和所谓的“Paypal黑手党”[4] 。他们与少量的计算机科学家一起 充当了当今许多数据科技公司的最大靠山。这种将企业和个人置于大数据价值链中的创新性想 法促使我们重新审视公司的存在价值。比方说, alesforce不再是一个单纯为企业提供应用软件 的平台,它还能挖掘这些软件所收集到的数据并且释放出它们的巨大价值。
一旦得以有效利用,大数据就可以变革公司的赢利模式和传统交流方式。我们举一个典型 的例子,通过得到竞争对手所没有的行业信息,欧洲一家汽车制造商重新定位了与它的一个零件供应商的关系。如今的汽车装满了芯片、传感器和各种软件,一经启动,它们就会及时把汽车状况信息发 送到制造商的电脑上。一个典型的中档车大概有60个微型处理器,车上电子仪器的价值占了车 辆总价值的三分之一。车载电子仪器之多使汽车成了“漂浮的观景台” ,这本是莫里用来形容船舶的。而这些设备监控到的汽车零部件的工作状况,能够在整合之后用来提高汽车的质量,因此,能够掌握这些数据的公司拥有非常大的竞争优势。
汽车制造商通过与行业外的数据分析公司合作发现,德国供货商供应的油箱的蒸汽泄漏检 测传感器存在一些问题,它会对好的油箱产生错误报警达16次。汽车制造商可以把这些信息反 馈给供货商要求修理。在商业环境更加和谐的情况下,也许会发生上面说到的情况,但是既然 汽车制造商已经在这个项目上花费了一大笔钱,它就会利用这个数据挽回一点点损失。
所以,汽车制造商开始考虑到底应该怎么做:卖掉这个数据?它值多少钱呢?如果供货商 推卸责任呢?如果是我自己在操作过程中出现了失误呢?而且它知道,一旦公布了信息,和自 己用同样零件的竞争对手也会改进他们的车。更明智的选择应该是,这些数据只能让自己受 益,自己的汽车能够有所改进。最终,汽车制造商想到了一个好主意。它通过改进软件而改进 了这个零件,而且为这次改进申请了专利。然后,它把这项专利卖给了供货商,价格是很长一 段时间内进行数据分析的成本的总额。
往期PPT、报告下载:
往期干货:
往期可视化阅读:
往期热文:
钱塘数据坚持“激活工业数据资产,完善工业发展生态”的核心理念,以“产业+金融+大数据”协同发展为主攻方向,积极打造工业领域最全面、最强大垂直搜索平台和用户工具平台,并逐步演化为国内最大的“工业大数据中央厨房”,成为推动企业大数据应用和产业金融应用加快发展的“核心动能”,从而真正实现企业大数据资产化,激活企业传统要素资产和新型数据资产。