英特尔首席工程师吴甘沙:奥巴马竞选的核武器竟是大数据|完整版
大数据会踏破人类智能的最后一道防线,大数据有哪些特征、思维和境界?如何学会经营“数据的你”?大数据对营销理论有什么帮助?大数据如何成为资产和货币?
首发|笔记侠 编辑|笔记侠 Even 活动|颠覆式创新研习社12月4日《创新模块之人工智能》笔记侠作为合作方,经主办方审阅授权首发完整版笔记,PPT照片来自陈猫咪,转载请联系kezhou20或回复“转载”,违者必究。
大数据和人工智能有什么关系?最近5年,人工智能放佛变成新的火箭,也换上新的引擎,这个引擎就是“深度学习”,燃料就是“大数据”。我们如何身体力行大数据?
我的身份主要是一名工程师,略懂商业思维,是一位尝试破坏性组织变革的技术管理者,希望成为用技术推动社会创新的赶潮人。作为一个赶潮人,我最近特别关心社会属性的创新,看看是否能够为这个世界做点什么。
现在大数据这么火,它到底是什么?有人说大数据就像是青少年谈性话题,每个人都兴致勃勃地说,但没有人知道怎么做;也有说人是新瓶装旧酒,没什么大不了;也有人说像一块所谓的玉石,挖开却什么都没有;也有人说大数据已经过气了,现在都谈人工智能。
其实大数据不神秘,每个人都可以身体力行,它不需要迷信的包装。首先,我想用大数据的方法回顾下大数据的前世今生。
它的元年在2011年,不知道大家有没有用过Google trends(谷歌趋势,是Google推出的一款基于搜索日志分析的应用产品,它通过分析Google全球数以十亿计的搜索结果,告诉用户某一搜索关键词各个时期下在Google被搜索的频率和相关统计数据),就是一个关于热度热度的数据,我们发现2011年在谷歌上关于“大数据”的搜索非常热门。
中国的“大数据”元年是在什么时候?用百度指数搜索之后,它是在2012年开始火起来的。2012年有两本书功不可没:徐子沛的《大数据》、舍恩伯格的《大数据时代:生活、工作与思维的大变革》,可见,中国在这个领域的研究和世界零时差。
美国Gartner(第一家信息技术研究和分析的公司,它为有需要的技术用户来提供专门的服务,已经成为了一家独立的咨询公司)发展了一个技术成熟度曲线:任何一个技术刚开始的时候,大家都会觉得非常好,必须要做,大家的期望值不停地提升,到了一个程度之后,发现这个期望没办法实现,进入幻灭期,很多吹牛、乘势而起的皮包公司就死掉了,市场又重新冷静发展起来。
我在观察Gartner公司2015年技术成熟度曲线的时候,突然看到大数据没有了,现在物联网、虚拟现实、企业级3D打印技术都在,但是大数据不见了。于是我找出了2014年的技术成熟度曲线,看看大数据是不是过气了?
其实,大数据现在不火了,但是技术却已经开始成熟了。媒体炒作和行业现状之间有一个延迟效应,不能把炒作看作是行业现状。关键词搜索只体现了一个侧面,因此,似乎也没什么人在谈大数据了,但这并不意味着它过气了。
我对大数据的定位是“寒武纪大爆发的钙:,寒武纪出现了生命大爆发,为什么会出现大爆发呢?因为地壳运动之后,海洋释放了大量的钙,在钙离子丰富的海洋,鱼出现了脊椎,然后慢慢开始有能力进入大陆活动。大数据是现在各种技术勃发的钙。2013年,我说大数据一定会打通6大行业:大数据、云计算、智慧城市、个性化制造(工业4.0)、移动互联网和物联网。从现在看,又有三个技术变得尤其凸显:虚拟现实、人工智能、机器人。
人工智能确实很重要,它希望机器达到人的能力水平,但是人是这个宇宙最大的智能吗?《超体》里面讲,人的大脑只开发了10%,到40%的时候,周围发生了什么,都可以一目了然,到100%的时候,能够打通古今的穿越能力。其实,我认为“人工智能帮助机器达到人的能力,大数据能让人达到上帝的能力”。《圣经》说过:“耶和华啊,你已经鉴察我,认识我。我坐下,我起来,你都晓得,你从远处知道我的意念;我行路,我躺卧,你都细察,你也深知我一切所行的。”因此,我认为大数据是上帝智能。
我认为把一件事情讲清楚,就要从这五个方面阐述:势、道、法、术、器。我今天主要从道、法、术三方面阐述大数据。
到今天,任何一个时间点,90%的数据都是在它过去的两年形成的,2010年,谷歌每两天产生的数据量相当于人类文明曙光到2013年数以万计的时间长河所产生的数据总和,数据产生了指数级增长,我们可以看下指数曲线当中有一个有趣的特征:一开始的进展是非常缓慢的,但是突然到了一个转折点后,就以爆炸式的方式发展,下一步的进步可以是前面所有步的总和。因此,我们说,任何一个时间点的进步都不会太晚,而不是说机会都被前人拿走了。
大数据为什么会产生指数级的增长?
第一,因为摩尔定律,我们直到,一旦一个事情可以形成规律,就可以有预测能力,就有自我实现能力;
摩尔定律是指出:每两年,单位晶体管密度会翻一番,这个定律不仅在半导体它带来涟漪效应,而且影响到数字社会的发展。
摩尔定义不仅仅是技术的规律,也是经济的规律,如果两年以后你生产的东西和今天的东西一模一样,你的营业额会下降一半,因此,这意味着你必须得不停地奔跑,光跑得快,还不够,还得“更快”。后来,随着性能的提升,就有了安迪-比尔定律,安迪是“只有偏执狂才能生存”的提出者,这个定律提出每次性能提升都推动软件和数据的高速发展。
随着晶体管变小、电池时间变长,贝尔定律指出:每过十年,计算机的形态都有显著变化,即更小、更便宜,然后产生更新的行业。上个世纪,60-70年代是小型机的10年,70-80年代是工作站的10年,80-90年代是台式计算机的10年,90-00年代是笔记本的10年,到了本世纪,00-10年代是手机和平板的10年,再下来就是可穿戴设备的10年。
第二,人是大数据的第一推动力;
伴随着互联网商业从产品为中心到以人为中心的转变过程,大数据的爆发。这个转变,我认为有三个特点:最小化信息不对称,消费者有选择权;交易成本趋向于零,消费者行为高频化,比如电商;覆盖长尾人群,更多消费者参与。
第三,杰文斯悖论指出技术进步导致资源利用率的提升,进而导致价格降低,最终增加资源的使用量,形成正向反馈。
再从大数据理论的层面理解:
第一,第四范式;
科学以前有三种范式,一种是实验,比如伽利略的比萨斜塔实验;一种是理论,比如牛顿的三大定律;一种是模拟,比如核试验,因为核武器会污染环境,所以采用模拟的方式;第四种就是数据探索,在历史上,有一个人基于行星运动数据推出行星运行规律,那就是开普勒。他看到了一个点,然后把点连接出来,便看到了一个运动的椭圆形轨迹。
数据探索可能会超越实践、理论和模式,成为新的范式。大家经常看到一个高大上的名词:计算信息学、市场信息学,它其实就是模拟信息的交互。未来大家会看到越来越多社会科学和大数据的结合,比如通过和社会学的结合,你会看到计算社会学。
第二,理论已死,数据方法论(经验主义)万岁?
数据方法论就是一种归纳法,它是不是可以取代理论?先来看三个概念:理论、模型和数据。我们如何获得理论呢?传统的科学方法是先大胆假设、小心求证,先建立一个模型,做实验,从实验中看到一个数据,然后看到更多数据,从而发现有些假设是不对的,同时又留下了一些假设,形成我们对于世界的理解。
模型就是基于我们对世界的观察,反映了我们对世界的理解。我们的理论和模型都是试图解释这个世界,理论赋予了我们预测未来的能力,这是理论的好处。问题是什么?当我们学得越来越多的时候,就会发现越来越缺乏一个模型能够完美地解释这个世界。牛顿的机械力学理论、爱因斯坦的相对论,再到量子力学,我们发现当我们采集的数据越多,越缺乏一个最简单的理论可以解释。当数据多到一个程度,理论已经是奢望,数据即是模型。
因此,大家说“理论”终结了,数据方法论占了上风。谷歌翻译并不是基于理论,比如词汇学(主语、谓语、宾语)等,之前在上世纪50年代的时候,翻译都是基于理论,但是想要做得很好,很难。谷歌基于大量的文库和词库数据,它不一定需要懂很多词汇和句法,它只要有数据,就可以很好地完成翻译。当然,数据方法论虽然很好,但是不能帮助你解释这个世界,理论可以。大数据只能发现当下知识疆域里面隐藏的未知部分,你还是需要靠你的天才想象力和理性拓展新的知识疆域。
第三,大数据的结论具有或然性;
相对于无限的样本,不管有多少有限数目的支持证据,归纳的普遍性概括为“真”的机率总是为零。以前大家都认为天鹅是白的,直到在澳大利亚发现了黑天鹅,“天鹅都是白”的概念就被打破了。
另外,作为一个观察者,可以改变被观察现象的存在,产生一些数据,然后影响一些人的观察行为,最后就影响了被观察事物。这个世界是以概率的方式存在的,因此这个世界是无法准确预测的。大数据顶多不过是一个消息比较灵通的算命先生而已,大数据获得的任何一个结论都是以概率的视角去审视的。假设你的预测带有偏见,你的预测也会影响未来的数据,大数据又会反过来加强你的偏见。
下面我给大家介绍三本书:《黑天鹅》(论点:这个世界是不可预测的)、《爆发》(论点:人类行为是可预测的)、《随机漫步的傻瓜》(虽然世界不可以预测,但是可以找到其中的概率)。
大数据有三个特征:大(数量)、杂(种类)、快(速度)。这是Doug Laney在2001年提出的。
第一,大的量度;
现在说大数据,都是ZB(十万亿亿字节:1000,000,000GB)的概念,互联网公司比如Uber是几十个EB(一百亿亿字节:1000,000GB),百度可能是几个EB,阿里巴巴刚刚达到一个EB,智慧城市是100PB(一千万亿字节:1000GB),电信和金融公司是10-100PB,医疗、零售公司是10PB,制造业总量非常大,但是平均每家公司很小,它有非结构化、颗粒度细、多维度、高活性四个特征。很多人说,我都没有PB,我能玩大数据吗?其实,大不如“杂”和“快”重要,当你数据增长的速度够快的话,都可以称之为大数据,它强调多元化和高速的流转。
第二,杂;
数据来源具有结构化、非结构化、多样性,比如基因大数据,它有药理学的科研数据、临床数据、个人行为和情感数据、保险公司的理赔数据、基因组和蛋白质组数据。多纬度是大数据价值的重要维度。不同维度之间的关联性是非常重要的,是大数据价值的重要因素。一个人有没有思想,就在于他能不能从各个侧面找到信息之后,从彼此的关联中总结出规律。
数据天生有混杂性和噪音,数据的质量(真实性、准确性和辨识度)影响数据的价值。淘宝有网页的数据,也有移动应用的数据,如果两个数据不能联动起来,就没办法产生对这个人的辨识,只有有辨识度才有价值。
第三,快;
为什么要快?时间就是金钱,面临同样大的数据矿山,“挖矿”效率就是竞争优势。ZARA的数据处理非常快,所以每个月度可以推出新的款式。像每件商品一样,数据的价值会折旧,最新数据才最有价值。同时,数据跟新闻和金融行情一样,具有时效性,你比别人快,就占有了先机。
反映“快”的一个属性就是数据活性,这是数据价值的另外一个重要维度。
在互联网金融里面,征信是非常重要的。征信当中会出现非常多的数据:财产数据、银行数据、电商数据、电信数据。比如财产数据当中的房产和汽车(特点是颗粒度粗、维度中等、质量高、活性低)、银行的刷卡数据(特点是颗粒度中等、多度低、质量高、活性一般般)、电商数据(特点是颗粒度非常细、维度非常高、质量中等、活性非常高)、电信数据(你每上一次网,就有数据,特点是颗粒度细、维度中等、质量高、活性高)。
大、杂、快对数据技术的要求是水平扩展、兼容并蓄、唯快不败,这样才能应对多变的世界。
这是牛津大学教授舍恩伯格在《大数据时代》提出的三大思维,咱们来思辨下。
1、要全集,不要采样
传统采样带来了一些好处,但是它有百分之几的误差,更会丢失黑天鹅的信号,所以要全集。但是我们要反问下:有没有可能拿到全集?我一直强调:不能只靠大数据做决策,因为你拿不到全部的数据,你做出来的决策一定是不安全的,而且现在很多数据都是在孤岛里面,所以你永远不要假设有数据全集。
大家一直形容大数据是一个矿山,但其实它是贫矿。更多的数据,就一定可以胜过采样吗?好的采样优于不均匀的大量。
2、要混杂,不要精确
舍恩伯格说混乱是现实,无法避免,更多的数据比少数高质量的数据更好、更接近真理。
我们还是要反问下:拥抱混杂性,等于喜欢混杂性吗?否。数据失去辨识度、失去有效性,就该扔了。“少量高质量数据+复杂算法”被“大量低质量数据+简单算法”打败吗?未必。
3、要相关性,不要因果性
他说,我们知道是什么就行了,不需要知道为什么。这里也需要反问:相关性都有意义吗?其实这种相关性只是一时的存在。
人容易快思考,根据一些表面的相关性得出一个结论。在美国的印第安纳州,肺核的患病率最高,是不是它的环境和空气质量不好?不是,那边空气质量非常好,所以很多肺核的患者都搬到那边住。有时候,我们知道是什么,也要知道为什么。
很多大批量的小决策,可能不需要因果性,比如我最近在亚马逊买书的时候,我会看到它连带推荐的一本书,跟我的需求都没有任何相关性,只是因为刚好我要购买的书和被推荐的书都属于同一批集体降价的书里面。小批量的大决策是不一样的,比如买房、买车,是需要因果性的,比如服用中药,被治好和中药的服用存在相关性,但是不是因果性?未必。西药如果治好了你,它会做大规模的、随机的对照,把治好病的相关因素都列出来,然后一个个排除,看最终是哪个药治好了你的病。因此,我们要防止伪因果性,有些伪因果性是弱向性。
针对刚才讲的维度,做一个案例分析:基于搜索的谷歌流感预测。
谷歌发现:大量人得流感的时候,会通过关键词搜索预测流感趋势。我们发现,谷歌在某个趋势上面预估过高,导致某些区域出现了大量的某种药品购买,也因此让另外的区域购买不到,而最后的事实并非如谷歌所预测的,因为如果有人搜索“流感或发热”,不代表真正得了流感。由此可见,这个搜索数据的颗粒度细、活性高,但是质量低。这些数据也不是全集的,它混杂性高、测不准、相关性不够,很多人是因为热度搜索而去搜索,最后又反过来加高了搜索热度。这就是一个失败的预测。
再看看谷歌的票房预测,它可以提前一个月进行票房预测,这个预测就做得特别好,有94%的准确性,因为这个数据的搜索颗粒度细,它通过电影预告片的搜索量、同系列电影前几部的电影表现、当期的季节性特征,是数据质量中等、活性高、相关性足够。
我们在判断一个数据是否为大数据的时候,可以从以上的三个必然性、三个理论思辨、三大特征和三大思维去判断。
大数据的价值变现方式
我们不要强调数据的体量大,而是数据的价值大。在金字塔结构里面,底层的数据是原材料(原生价值,没有意义的),在往上的信息是原油(衍生价值),然后再往上的数据是资产(具备初次和再利用价值),最后数据是货币(有交易的价值)。
大数据有六种价值变现方式:
1、知著(见天地、见众生)
因为从采样到全集,是注重个体而非平均,可以看到黑天鹅的身影,听到长尾的声音。传统收视率的调查是通过打电话问询,现在是通过数据机顶盒。同样,我们可以在Twitter上预测股民的情绪指数,这是从定性向定量计算的。我们常说个体是理性的,群体是非理性的,但是通过大数据,可以看到非理性的轨迹。
2、见微(见自己)
这个市场是所有人行为的综合,我们通过对市场的了解看到众生图,但只是马赛克的众生图,现在通过大数据可以看到高清的众生图。因此,人群可以从细分到微分再到个人,对个人的刻画已经从个性化变成个体化。作为消费者,我们也希望商户以个性化的方式来对待我们。对于产品提供者,原来专注于以客户为中心,开始转型以用户为中心,客户是买单者,但是用户是一直在使用者。我们原来关注对方是中产阶层、交易次数,现在关注他的行为、意图和意向,比如经过几次的浏览来到我们的页面,又或者他在微博上发布了和我们产品或相关产品的信息,这就是见微的过程。我们以前关注交易的点,现在注重他浏览的线和过程。
3、当下
什么是当下的价值?提高时间效率,抓住先机,就是快鱼吃慢鱼的概念。同时,数据价值是存在半衰期的,因此,现在会通过购物篮分析,也就是通过你的购买和挑选预测你的需求,而不是购买后再分析。传统的人口普查有滞后期,现在通过手机就可以做人口普查,因为每个手机都是实名制的。这些都是可以在当下完成的,在数据价值没有衰变的时候获得价值。
给大家一个关于见微和当下的思考。天气预报对我们这个社会带来的好处是巨大的,但是现在的天气预报有什么问题呢?它能知著,不能见微。PM2.5也一样,我如果跟大家说我做一个天气预报的创新,别人的第一反映就是这还需要做吗?而App“彩云天气”做的是当下局部地区的天气预报。
4、皆明
皆明是同时考虑过去、当下和未来。《西游记》里面出现了两个孙悟空,一个知前后、万物皆明,这里分为描述性分析(过去发生为什么?为什么发生?)、预测性分析(料事如神)、处方性分析(运筹帷幄)。而描述性分析的价值是马后炮,大数据的价值就是对未来的可见性,后两者就具备这个价值。预测性分析的种类包括经济发展、选举、票房、地震、股市、选举预测等等。2011年日本地震,美国海洋与大气气象局提前9分钟预报。预测性分析是预料未来会发生什么,而处方性预测是希望未来发生什么,然后提前做一些事情让未来发生。比如预测东风会来,这是预测性分析,而草船借剑就是处方性分析。
在决策支持当中,如何提高响应度、降低流失率?我举一个例子,Next flix是一家视频服务公司,奉行全球的连续剧《纸牌屋》就是这家公司制作的。这家视频服务网站针对用户做了三种分析:描述性分析(用户在做什么)、预测性分析(用户未来需要什么,然后进行推荐)、处方性分析(知道用户需要什么,然后制作相应的电影)。
一切数据皆为信用,除了财产、银行、电商、电信,还有什么可以作为数据?一家公司说我采集了一个数据,发现对方在输入身份证信息的时候,输入的时间比较长,可能对方在作假,身份证不是他的。还有的公司说一个人平常固定用一个ID上网,最近换了一个ID,是否换了工作?因此,要做到皆明,就是把一切数据拿来。
5、辩讹(求真)
湖南发现有一个地方用电异常,后来发现竟然有人在偷偷制造枪支。
6、晓意
现在大数据会踏破人类智能的最后一道防线。电影《魔球》里面,一位棒球经理利用数据分析找到被忽略的人才,然后把他们集合在一起获得了很好的成绩。数据分析的秘密是让球探去评估,这是传统数据分析没有办法响应的地方。
1、量化
量化虽然不能带来直接的好处,但是量化相当于给你的企业加上仪表盘,相当于数据史观,完成日志化、无纸化、自动化、工具化、移动化、社交化。
企业内部的核心数据有这四类:运营数据、财务数据、产品数据、员工数据,同时还有全渠道的用户数据:移动终端、实体零售、网站网店、呼叫中心。外部的数据有公共数据(开放数据、社交媒体数据、开放平台数据、社交网络数据)和竞合数据(数据市场数据、上下游数据、竞争对手数据、第三方数据)。
企业数据是结构化的,互联网和社交网络数据是半结构化、多结构化和非结构化综合存在的。
量化的数据中有一些误区:数据虽然是原始的,但未必是客观的,它依赖于观察者本身,经过人主观的筛选,数据可能就变味了。我们常常在搜索的时候会打错别字,大家会认为是数据废气,但是谷歌就把它搜集起来,在你以后搜索的时候可以自动更正。有的公司只关注看得到的数据,而忽略真正的问题,有的公司以为看到的数据就是全部的数据,有的公司忽略了数据的有效性,因为数据一直在变化。
除了企业数据,还有个人数据,它包括人的画像、数据画像、数字身份、社交威望等等。我们说我们创造了技术,其实技术也影响了人,我们通过数据的不断刻画,成了“数据人”,“数据人”也会对真实人的行为发生影响和改变。我们要学会经营“数据的你”,当然,数据有好处也有坏处,坏处就是数据忠实记录,永不擦除,有可能你的数据被滥用、歧视,有时候它的预测可能会给你带来困扰,所以我们要懂得经营自己的数据。
2、效率
越少时间、越少支出、越多产出,这就是效率。都通过量化、洞察、行动这三步可以提高效率。比如运营优化,经过量化就可以获得洞察,发现哪些互动是无效的、是没有产出的;比如业务拓展,通过量化货架数据,洞察缺货商品,然后在行动上及时补货;再比如风险把控,在量化时可以随时倾听运行机器的杂音,然后预见故障,最后及时更换,这样就不会让机器断线;再比如决策的科学性,在上百年之前,婴儿出生后,护士是基于主观去判断婴儿会出现什么情况,后来一个医生发现:只要量化心率、呼吸状况、肌张力、反射和肤色几个要素,得出阿普加评分,最后才能采取准确的行动。
再比如谷歌的氧气计划,通过10000项对经理人的观察,获得超过100个的变量,包括各种不同的业绩评估、调查反馈及其它报告,得出合理的行动:前后5轮的招聘面试、午餐排队时间4分钟最适合同事间进行聊天、对于员工而言直接加薪1000美金比2000美金更容易接受,从而依此相应改变了HR实践。
因为数据有噪声、有欺骗性、不全面,这个时候你把它泛化成所有数据是有问题的。我们很容易受到相关“快思考”的诱惑,其实大数据只能做预测,不能预言,它能够告诉你的是概率。
3、个性
在互联网的免费商业模式里面,每个用户都是商品。在营销理论中,4P注重产品,4V注重功能,4C注重用户,4S注重用户满意度,4I注重社交,这些都是不同的营销理论,但都是反映一个事情:搜集数据,做精准营销。
因此,首先你要获得客户数据,不断对客户做画像,然后实现基于兴趣图谱、社交图谱、事件图谱的个性化和精准广告、推荐、促销,甚至完成交叉销售等。
给大家看一个广告精准营销的案例,比如雅虎网站上面的广告位,用户在浏览的时候,马上会从广告发行商发送一个需求到SSP供应方平台,表示这里可以放一个广告,然后送达到广告交易平台,最后呈现给DSP需求方平台,当需求方平台把信息反馈给到广告交易平台的时候,就会进行实时竞价,比较谁给的价格最后能够入标,这个需求方平台的广告主从程序化创意平台产生创意,最终让用户辰工浏览,这个过程只有一百毫秒之一,是瞬间完成的一件事。
当你有了精准营销之后,就可以转化用户,与用户建立长期关系,建立黏性。
在用户的量化指标里面,有活跃度、访问次数、访问深度、停留事件、位置信息、跳出率、购物行为、转化率、放入购物车、下单次数、在线支付、流失率、预测分析、维护机制等等。我们应该强调用户的潜在和长期价值,然后通过病毒传播。
在长期关系里面,要进行个性化促销、个性化定价,注意:动态定价不等于个性化定价。不过,对标准、非稀缺产品的个性化定价是有问题的。
做个性化最厉害的是Gary Loveman,他去了Harrah's,这是全球最大的赌博集团,他先做了会员卡,最低价的就是金卡,你在那边消费、住宿都要用卡,这样可以收集所有数据。当客户一旦排队超过一定人数的时候,他就增加新的老虎机,他发现最有价值的客户是退休的中产阶级,针对这些客户的长期价值采取优化策略,他发现客户输到900美金的时候就会崩溃,于是会在客户输800美金的时候就会派人送餐券,建议对方可以休息下。
4、创造(新产品和服务)
我们经常对客户需求进行了解,但是客户做的不一定都对,曾经的人们要的是“更快的马车”,而不是汽车。传统学习的价值是安排统一进度,但是我们通过大数据可以观察更多的反馈,尤其通过慕课(MOOC,新近涌现出来的一种在线课程开发模式,它将学习管理系统与更多的开放网络资源综合起来,与传统课程只有几十个或几百个学生不同,一门MOOC课程动辄上万人,最多达16万人,以兴趣导向,凡是想学习的,都可以进来学,不分国籍,学习在网上完成,不受时空限制)可以得到更多的反馈,给你更好的教育。未来慕课一定会流行的,但不会是最后的解决方案,还需要通过线上学习和线下组织学习以及虚拟现实,实现个性化的学习。
最后总结下创造的手法:从营销的个性化到产品的个性化;从产品设计的人性化到产品设计的新奇性;产品的拟人化;从数据换取免费服务;利用前后“皆明”获取跨时空的价值。
5、生态
这是最高的境界,你掌握了生态,你在竞争中就能获取有益的地位。数据的拥有者、提供者、创意者,加起来就是大数据的生态,生态是壁垒和护城河。你玩生态,就一定能改变竞争的格局。互联网一直强调生态是“应用+终端+平台”,形成真正的价值,它既是数据的提供者,也是数据的创意者,也可以进一步提供数据的基础设施服务,它可以丰富自己的生态系统。
传统产业也可以做大数据的生态,雅昌是一家传统的印刷公司,它建立了一个艺术品数据库,然后建立了门户网站。当有了数据之后,它做艺术品指数和行情分析,提供艺术品数据资产管理,再到最后提供艺术品搜索、认证、电子图库。有了这些就衍生了更多实体产品,如收藏、衍生品、艺术策划和印刷,这是一个自我强化的价值网。
未来,我们会基于云计算的开放生态,解决计算速度的问题,现在我们有一个愿景:2020年前,做完全基因检测序、锁定癌症相关基因,形成个性化治疗。注意,主义,生态是开放创新的温床。
人工智能可能需要花几十年的时间,使机器智能变成猴子的水平,但是机器智能从猴子的水平到人的水平,可能一瞬间就完成了,前者是算法带来的,后者是大数据带来的。
最后,我说一个案例,2012年美国竞选,奥巴马和另外一个竞选人罗姆尼共同筹集了20亿美金,但是奥巴马赢了,他的核武器是什么呢?
首先是量化,竞选的时候,最需要关注的是摇摆洲,所以奥巴马团队随时关注和监控摇摆洲的投票倾向,一旦发现不对,就进入干预;第二是效率,在Facebook做信息推送,让支持者身边的摇摆者注意到;第三是个性分析,发现目标选民喜欢的明星,然后在对方的家里搞竞选晚宴;第四是创造,通过第三方获取目标选民喜欢什么样的电视剧,然后推送相应的广告。奥巴马把大数据的几个境界都运用了。
再说下智能物流。物流包括客流、商流、资金流、信息流,客流是用户思维,商流是电商思维,资金是金融思维,信息流是互联网思维,所以要做运力规划和实时调度、突发事件预测、路线优化、仓储优化,这些都是为了效率。它针对危险品、冷链、医药做不同的物流,这是为了个性。最后通过大数据雷达,发现金融信息服务,这就是运用了生态物流。
在客流上,它知道用户的信息数据,也知道谁寄了东西,这里形成了物理的社交网络,这里的用户数据也可以变现,这就是生态。
在商流上,它可以自动匹配生成订单,这就是效率,它可以还可以做生态链信息联动,这是生态。
在资金流上,钱在哪里?呆多久?贷在哪里?呆多久?谁的货?谁要钱?这就是量化,而且也变成了金融行为。
最后在信息流上,以应用和终端为触角,以多边平台为中介,以数据整合、价值挖掘为核心,把大量的社会运力池、货主资源整合起来,然后给拥有卡车的人免费,以这些资源去找电信公司、中石化公司、保险公司,获得交叉补贴,完成数据、资金和服务等价值链的重构。
点击阅读原文,详细了解前百度研究院副院长余凯先生对机器人领域的洞察~
笔记君:学到了这么全的大数据知识,我要赶紧回家好好分析分析数据了~
回复大咖名字,查看精彩笔记
KK丨克莱·舍基丨周鸿祎|李善友丨傅盛|余晨丨龚焱丨徐新丨 阎焱丨俞敏洪丨李丰|宗毅丨蔡文胜丨吴晓波丨段永朝丨张邦鑫丨赵迎光丨罗振宇|吴声|伊光旭丨李欣频|张怡筠丨王东岳...
互联网笔记合作伙伴
颠覆式创新研习社|创业邦|中欧商业在线|中欧战略系|黑马会|复旦大学|李欣频私塾课|互联网大篷车|行动派|中关村国际创业节|福建省互联网年会|俺来也青春创业营|葡萄创投|碳九学社...