2016大数据的六大清晰趋势、五大颠覆空间、三大行业机会

查看原文

其他

2016大数据的六大清晰趋势、五大颠覆空间、三大行业机会

2016-03-23 数据观

文丨车品觉

最近“大数据”似乎已经过气了，但在我看来，真正的大数据应用和市场在2016年才刚刚开始萌芽。

为什么？数据不仅仅只是数据。

大数据的创新价值可以来自新连接的数据、算法或者产品本身。

过去两年大数据的成长和智能手机的有着紧密的关系，加上IOT的浪潮正在酝酿之中，online与offline的接合带来了更深度的数据关联，触碰到消费者的全渠道行为收集。大数据相关的APP已经集媒体、通信、社交及传感器于一体。

数据收集正从求量转为求质。

很多企业不再迷信大数据，而是更踏实地收集一些对解决当前问题有用的数据。大家对大数据的态度从2016年开始会变得更谨慎，而且会进入专业领域。

我的建议是，2016年要认真思考：怎样看对问题、看懂问题，通过数据的思考达到落地实践。

2016数据六大趋势

变是唯一的不变

说到趋势，人们往往习惯从改变的现象作观察，但是如果当我们把视野格局放大，在大数据的长期发展趋势中，找出变化的本质，反倒是让我们更容易看清楚动向。从这个角度出发，我至少可以看到未来的2-3年，有几项已经存在的趋势正在扩大中： 1.应用无线化：提供了更大的便利性与移动性、让终端设备与资料采集的作业更弹性而有效率； 2.信息数据化：让讯息的流通、交换、加工、运用更趋标准及结构，DT时代数据的应用变得更即时直接； 3.交易无纸化：彻底的改变了我们交易行为与资金流，并赋予未来微经济商业模式更多创新思考的可能性； 4.人类智能化：大数据所产生的创新价值与人类交互并深入于生活之中，人的思维与新科技将会遇上前所未有的碰撞； 5.决策实时化：透过大数据实时采集及加工改变了决策与信息关系。过去的世界因数据不能低成本获取，决策的实时性和精确难以达到； 6.线下线上化：未来仍将呈现线下更多的运用线上数据倾倒的趋势，线上与线下将连接在一起不能分割；
这些本质上的转变会持续好几年，六个趋势会在各自的体系内深化发展与创新。商业价值会逐渐落地于各行业中，数据技术成为各行各业的优化工具或产生颠覆性创新。大数据本身的发展也将被自我颠覆，数据的釆集、更新、识别、关联将会变得越来越自动化。

从数据趋势可见的五大颠覆空间

1.数据安全

2015年数据安全事件频发，随着全球各个国家开始采用新的数据安全技术和新的数据保护法律，2016年对数据安全的监督要求将会变得越来越严格。在数据安全方面，人们对个人隐私的保护比商业机密的泄露更为关注。数据安全意识提升的背后，代表的是对数据开放的风险与疑虑。如果数据风险无法被有效管控并建立个人对数据的信任感，对于正在发展中的大数据产业将会形成一种阻碍。个人的隐私、公司机密乃至于国家和国家之间的数据保护，将会是2016年快速成形的趋势，当数据成为商业重要且关键的资产时，随之衍生的可能会是像「首席数据隐私官」这样的职业。或许很多人会觉得匪夷所思，但是我相信到了2016年，很多拥有大量数据的公司都将把“首席数据隐私官”视为一个重要而关键的角色。

2.分析的简化与外包

数据分析工作的外包其实是一个概念上的举例，其实我要谈的是大数据背后将会形成的产业链分工。随着大数据应用的落地，很少有企业可以独立完成从原始资料采集、加工、分析乃至于落地应用的完整程序。未来数据的不同处理阶段，都有机会发展出专门的技术公司协助企业完成大数据应用前的整备工作。对应前面提到的“大数据创新循环链”的概念，每一次的大数据变革阶段激荡出新的问题与机会后，新的问题开始聚焦，对应的数据源也趋于集中，这时一个新的产业链机会也就随之产生。中间层(Middle layer)的服务与创新，对于大数据产业的发展将扮演至关重要的角色。

3.政府的数据态度

从整个数据地图看，政府是拥有最多数据的“财主”。因为政府锁定了很多公共服务领域的关键数据源，是公共数据开放的大资源，也是大数据驱动的一把金钥匙。政府的数据涵盖能源、金融、交通、治安、医疗、环境、食品等等。你发现所有的数据都是相对集中又非常重要的。政府数据的开放将是产业创新的催化剂，这背后也代表，政府大数据政策对于整体数据产业的发展非常关键。2016年我们可以观察政府对于公共数据开放的态度，而各个行业也可以顺应政府数据政策的脚步，开始尝试进入大数据驱动乃至于大数据变革的第三阶段。

4.多屏时代

过去的两三年，我们看到PC被手机颠覆了。但手机会被颠覆吗？虽然短期内还不知道，但我可以预见有两个新的屏会出现:一是Smart TV，二是物联网汽车。 Smart TV是家里的屏，收集你看节目的数据和推荐你喜欢的节目，形成了天然的数据闭环；物联网汽车则是第二个非常关键的屏，将来所有汽车的内部都会像特斯拉一样：一个大屏控制汽车中的每个部分、记录汽车行驶中的各种数据，因此产生信息的流动。

最近爱立信(Erickson)公司针对全球40个国家、10万名消费者进行了一项未来载具的调查，研究结果显示超过一半的受访者都认为智能型手机将会在五年后被淘汰，取而代之的是具备AI功能的新设备。

但是我的观察很简单，就是从两个层次的分配来思考这个问题：时间分配(Time Share)和载具分配(Device Share)。人在不同的时间段会因为当时的环境状态，对不同的设备有不同程度的依赖。在家时对Smart TV的依赖会比手机高；离开家往下一个目的地移动，大众工具方面我们需要的是手机，如果是自己开车，车用导航或是行车电脑的屏幕就会成为主要的关注对象。所以我不太在意五年后我们拿在手上那块屏幕是否仍称之为手机，而是更在意人会如何与那块屏幕互动，以及互动的过程中我们如何采集到有价值的数据，并进一步对使用者的日常生活做出优化的回馈。

5.数据行业化

所有大数据的落地点都与行业相关。

互联网影响比较大的行业必然容易数据化，已经冒出头来的有金融、医疗、电商等行业。下一步的大数据应该会在不同的领域各自发展，不会有一个全盘通吃的方案，成为每一个领域的解决方案。包括零售、医疗、教育、金融等行业，都将因“互联网+”的带动而发展。很多小公司起步，产生了很多小数据，这是从0到1；然后整合碎片化的数据，最后积累大量数据。这三个进程的时间点加上不同的应用，铸就了行业大数据。未来大数据将从过去的浅层连结(weak link)转变为深层连结(deep link)。大数据由浅而深的演变中我们可以观察到：从前大家习惯以行业为出发点，思考网络(数据)可以帮我做什么；到了互联网和大数据的时代，则会以网络(数据)为出发点切入思考，再把原行业的的思维放进来碰撞，看看可以激荡出什么样的创新思维。 Uber、Airbnb都颠覆了过往行业运用网络的概念，只有这种思考与创新的方式才能将跨行业的东西提升出來。

大数据应用下的三大关键行业机会

如何在未来新空间里获得商业机会？在我看来，主要的机会在于中间层，尤其是在金融、医疗、零售这三个行业。

1. 金融与保险

如果让我用一字道尽金融在大数据时代的机会点，那就是“微（micro）”。过去很多的创新都被技术和数据的能力所局限。未来数据的采集、加工和应用都将实践个人化的价值，将会激发很多金融商业模式。数据动态的意义，首先体现在金融保险体系里的客户监测：过往个人信用评估结果，往往无法有效地反映最新的个人信用风险，导致银行或是保险公司不能提供最符合顾客需求和利益的服务；其次体现在将解决服务合理性的问题，也就是当客户使用了服务时，才向客户收取费用。
以汽车保险为例。过往我们对于汽车保险的保费设定，是根据客户过往的驾驶肇事记录来调整保费费率，也即汽车保险的游戏规则，建立在投保车主的驾驶安全行为基础上。

但肇事记录其实是一个相对落后的事实指标，在大数据时代难道没有更动态的数据可以预测危险驾驶的风险吗？当然有，而且来源还不只一项。
未来的汽车都会像特斯拉一样，通过车内安装的传感器，记录驾驶员如何踩油门，（如习惯性的紧急刹车就是一种危险驾驶的讯号)、换道时是否打方向灯、是否频繁地按喇叭……
这些资讯都可以侧写出驾驶员是否拥有安全的驾驶习惯。如果再把驾驶员的行车路线数据与政府公布的危险肇事路段的数据做对比，就可以知道这辆车每天上下班的路线属于怎样的安全等级。综合以上两类数据，即便没有肇事记录，保险公司也能根据这些数据来动态调整对这台车的风险评比，并随时机动地调整保费的费率(动态费率)。同理，如果车险是为了确保用车人在驾驶期间的风险，那通过车辆的传感器，可以清楚了解这辆车有多少时间停在车库、又有多少时间处于被使用的状态，保费的计费也可以根据车辆实际承受风险的时间来客对客户收费，这也就实现了前面所提到的动态计价。

2.医疗

医疗领域当前所面临到的最大问题是数据未能整合。比如在A医院却拿不到之前我之前在B医院开的病历。另一个大问题是中国人口老龄化严重，导致医疗费用负担沉重，因病返贫十分常见。只有降低医疗成本，减少滥用资源和药物，才能根本性地减少政府负担，让资源分配给真正需要的人。美国福特公司的30万员工，每年享有30亿美元的医疗保险预算，但这笔钱过去只有一个人在管。1997年福特在这方面第一次引入数据应用，分析之后发现有人竟然150岁还在领医疗保险，有人一年领两次怀孕补助等不合理的状况。这些都是无谓的资源浪费，但如果不通过数据，可能永远也不会发现这样的谬误。医疗是一个连续性的行为，一个人从健康、亚健康乃至于疾病的阶段都不是突发的，背后都有遗传或是生活饮食习惯的脉络可循。很多疾病的危险信号常常是因为信息未能互通而被忽略，像美国就曾经通过传染病传播数据，预估要生产多少疫苗以及各区疫苗使用状况，大大地提升疾病防治效果。

3.零售

对零售业最重要的，就是如何用数据把供应与零散的需求做匹配。买家希望得到的是：“我要什么？最快帮我找到我要的东西。给我最好的价格，用对我最方便的方式付款，在刚好的时间送达”，商家就会成为赢家。供应方则希望知道：“怎样才能满足消费者？怎样用最小的库存，最快的方法，最合理的利润率来服务顾客？供应链的处理怎样可以变得更好？怎样减少成本浪费？” 以数据驱动为基础的线上零售发展已经十几年了，但线下将会出现什么情况？当POI逐渐成熟，拿着手机，处处都能发挥大数据的连接能力，时刻都是机会点。人们懒得再特地下载一个应用程序购物，线上再发达，某些时候它也不是最方便的渠道。改善零售用户的体验型态只有全渠道。对零售业来说，最好线上线下都能覆盖到。只有online的应用程序是不够的，最好连offline的渠道都能拿到，不然很容易就被别人弯道超车，全渠道的打通和合作策略是零售业在2016要关注的第一个重点。

“推荐”将是另一个爆点服务。现代人能在同一时间享受多种服务，浏览多种产品讯息。但数十万款与你有关的商品摊在你的眼皮底下，你怎么选择？人主观上都希望自己可以选择，但面临太多选择时，选择本身反而变成了一种负担。所以未来的“推荐”应该是游合于“优选”与“逛”之间。大数据让手机变成个人消费助理，不断跟着你走，也不断领着你走，就会在商家和消费之间成为一个媒介。最后，零售业的根本是“生产”问题。数据将成为产品创新和改良的依据，从设计到生产、包装、销售、售后的过程中观察与不断优化，最终能够帮助商家生产出符合顾客需求的商品。虽然是老话一句，但是还是不得不在重申一次：“大数据时代对零售业来说不是一个单纯的转型问题，而是一个攸关存亡的生死问题。”

来源丨造就

作者：车品觉，浙江大学管理学院客席教授，中国计算机学会大数据专家委员会副主任、华人大数据学会执行会长。

【点击“阅读原文”进入「车品觉」在数据观的专栏】

●推荐阅读●

大数据商业智能的十大戒律

编译丨车品觉

导　读

1、不要将数据提取出来，做成数据集市和数据立方，因为“提取”就意味着转移。

2、记住了，安全即服务。

3、扁平化会毁掉原始结构中所表达的重要关系。

4、用户希望和可视元素进行交互，得到他们正在寻找的答案，而不是对你已经提供给他们的结果进行交叉过滤。

5、创造数据的人很多，但利用数据的人却很少。

如今，各路企业和组织都不再使用上一代架构来存储大数据。既然如此，为什么还要使用上一代商业智能（BI）工具来进行大数据分析呢？在为企业选择BI工具时，应该遵守以下“十诫”。

第一诫：不要转移大数据

转移大数据代价高昂：毕竟，大数据很“大”，如果打包转移，负担太重。不要将数据提取出来，做成数据集市和数据立方，因为“提取”就意味着转移，会在维护、网络性能附加处理器方面造成纷乱庞杂的问题，出现两个逻辑上相同的备份。让BI深入更底层运行数据就是大数据萌发的最初动力。

第二诫：不要偷盗！或者说不要违反企业安全政策

安全并非可有可无。不幸的是，数据泄露事件频繁发生，这表明实现安全并非易事。要选择能够利用现有安全模型的BI工具。依靠Ranger、Sentry、Knox等综合性安全系统，大数据可以使实现数据安全变得更加容易，现在就连Mongo数据库都有了令人惊叹的安全架构。所有那些模型都允许你插入权限、将用户信息一路传播到应用层、实施可视化的授权和提供与该授权相关的数据志。记住了，安全即服务。

第三诫：不要按照用户数和数据量付费

大数据的一个主要好处在于，如果做好了，它就能实现极高的性价比。把5PB数据存储到Oracle可能会让你倾家荡产，但存储到大数据系统则不会。尽管如此，在付钱购买之前，应该警惕某些价格陷阱。有些BI应用按照数据量或者索引数据量向用户收费。千万当心！数据量和大数据使用量出现指数式增长是再平常不过的事情，我们的客户曾目睹其访问量在短短几个月时间里从数百亿次猛增到数千亿次，用户数扩大50倍。这是大数据系统的另一个好处：渐进式可扩展性。不要被低价所迷惑，去购买一种会对企业增长征收“高税”的BI工具。

第四诫：要贪大胆借鉴别人的可视图

分享静态图表？这些我们已经做过了，无论是PDF文档、PNG图片还是电邮附件里，到处都在传播静态图表。但对于大数据和BI，静态图表还远远不够：你拥有的一切无非都是些漂亮的图片罢了。你应该让任何人都能够随心所欲地与你的数据进行交互。应该把可视化看作是驾驭数据的交互式路线图。为什么要闭门造车呢？将交互式可视化手段公之于众只是第一步。看看Github的模式就知道。与其说“这是我的最终发布产品”，不如说“这是一幅可视图，复制下来，分解它，我就是从中得到那些见解，看看它还能用于其他哪些领域”。这会其他人从你的见解中学到有用的东西。

第五诫：要分析天然形态的数据

大数据是“非结构化”的，这样的说法我们已经听过太多太多。其实不然。财务和传感器会产生大量的键值对。JSON（可能是当下最流行的数据格式）可以是半结构化、多结构化等等，Mongo数据库对这种数据格式下了重注。JSON具有好处理和可规模化的优点，但如果把它转换成表格，表达力就会丢失。很多大数据仍然被制成表格，通常拥有数千栏。你不得不为所有的值寻找关系：“在那种情况下……从这里选择这个”。扁平化会毁掉原始结构中所表达的重要关系。远离那些对你说“请把数据转换成表格，因为我们一直都这么干”的BI解决方案。

第六诫：不要无限期地等待结果

在2016年，我们预计数据处理速度将会变得快起来。一个典型方法是联机分析处理（OLAP）立方，本质上就是把数据转移到预计算缓存，从而加快处理速度。问题在于，你必须提取和转移数据（请看第一诫），以便建造数据立方，然后才能加快速度。现在，这种方法能够在一定的数据规模下良好运转，但如果临时表格过于庞大，你的笔记本电脑在试图将表格本地化的时候就会崩溃。当你提取新数据重建缓存时，新数据的分析就会中途停下来。此外还要注意样本问题，你可能会得到一个看起来不错、效果很好的可视图，但最后却发现全不对路，而问题就出在缺少大局观。要选择那些能便捷地不断调整数据的BI工具。

第七诫：不要制作报告，而要打造应用

在很长一段时间里，“获得数据”意味着获得报告。在大数据时代，BI用户希望从多个来源获得异步数据，这样他们就不需要刷新任何东西，就好像浏览器和移动设备上运行的其他各种东西。用户希望和可视元素进行交互，得到他们正在寻找的答案，而不是对你已经提供给他们的结果进行交叉过滤。Rails等框架使打造Web应用变得更加简单。为什么不对BI应用做同样的事情呢？没理由不对这些应用、应用程序接口（API）、模板、可重用性等等采取类似的做法。现在是时候通过现代Web应用开发的透镜来看待BI。

第八诫：要利用智能工具

在提供基于数据的可视图方面，BI工具已经证明了自己的能力。现在则轮到在模型和缓存的自动维护上下功夫，这样一来，终端用户就不必操这个心了。在庞大的数据规模下，自动维护几乎是不可或缺的，我们可以从用户和数据与可视图的交互中获得大量信息，现代工具应该使用这些信息来对数据网络效应加以利用。另外，要选择那些内置全面搜索能力的工具，因为我曾见过有些客户拥有成千上万的可视图。你需要一种迅速查找的方法，在网络的长年熏陶之下，我们已经习惯了搜索，而不是翻找菜单。

第九诫：要超越基本范畴

如今的大数据系统因为预测分析能力而著称。相关性、预测和其他功能使企业用户比以往任何时候都能更便捷地进行高级分析。不需要编程经验就能处理大数据的可视化技术让分析师如有神助，超越了基本分析的范畴。为了实现其真正的潜力，大数据不应该依赖于每个人都变成R预言程序员。人类非常善于处理可视化信息，我们必须更加努力地将可视化信息呈现在人们眼前。

第十诫：不要只是站在数据湖边，等着数据科学家来干活儿

不管你是把大数据当成数据湖还是企业数据中心，Hadoop已经改变了数据的处理速度和存储成本，我们每天都在创造更多的数据。但在真正利用大数据为企业用户服务方面，常常存在一种“只写系统”——创造数据的人很多，但利用数据的人却很少。

其实，用Hadoop里的数据可以为企业用户解答数不清的问题。BI讲究的是打造数据可视化应用，为日常决策提供支持。企业里的每个人都希望做出数据驱动的决策。把大数据能够解答的所有问题局限于需要数据科学家来处理的问题，这是奇耻大辱。（来源: datanami，作者：Shant Hovsepian，编译：车品觉）

数据观面向全国招募编译团队志愿者

☛大学英语6级以上水平或有翻译经验者优先

☛职业/性别/年龄/专业/院校/工作地点不限

☛回报：表现优秀者可提供正式的工作机会

☛报名方式：联系该微信号 cjm729363738

「一周精选·点击阅读」

■三个大数据平台在贵阳揭牌成立（到贵阳创办大数据企业最高支持700万元）

■大数据应用的三个阶段（辅助产品-创造价值-塑造我们）

■十三五规划纲要发布(关于大数据的都在这里)

■长文干货丨如何用大数据驱动产品和运营？

■收藏丨大数据：Hadoop族群介绍