易观CTO郭炜:大数据也进入了下半场,业务与算法是重中之重(附:大数据创业建议)
在资本寒冬的影响下,大数据也进入了它的下半场:大数据从人人都喊大数据,开始进入到企业实用阶段;投资人从看团队、看产品进入到看收入看客户的阶段。收入和增长成为大数据公司融资下半场的门票,而打赢下半场两个核心围绕业务理解和核心算法逐步展开。
作者 | 郭炜
本文长度为3500字,建议阅读7分钟
本文为数据猿年关策划活动《大数据的2016,我的2016》系列稿件,感谢本文作者 易观CTO 郭炜 先生的邀约投稿(数据猿专访郭炜)。
敬请期待春节后的2月16日,由数据猿与中欧商学院、腾讯视频共同举办的高端领袖线下演讲栏目中欧微论坛之《超声波》。
“数据是有灵魂的”,在我一直寻求数据灵魂的道路上,又走过了一年。2016这一年发生了太多太多的事情,Alphago 战胜了李世石,资本寒冬的到来,Spark 2.0发布,我也加盟易观这家专业的大数据分析公司,从过去一个大集团军的炮兵连连长,变为小集团军的军长。
2016年,大数据整个行业也发生了很多重要的变化,我根据自己的观察,简要地分析下2016年大数据行业发生的四个重要变化的理解:
大数据的下半场
在2016年,王兴说,互联网已经进入了“下半场”,互联网人口红利的时间已经过去了,需要对用户的深耕细作获得更多的收入和利润。过去的一年里,也涌现了很多不同行业不同技术的大数据公司,从舆情分析到数据平台,从产品用户分析到金融风险评估,每一家公司都看上去有独门绝技。
但是在资本寒冬的影响下,大数据也进入了它的下半场:大数据从人人都喊大数据,开始进入到企业实用阶段;投资人从看团队、看产品进入到看收入看客户的阶段。收入和增长成为大数据公司融资下半场的门票,而打赢下半场两个核心围绕业务理解和核心算法逐步展开。
准确业务的理解、抓住痛点可以确保大数据不是空中楼阁,帮助企业解决实际问题从而获得高额收入。
而算法的门槛是继大数据采集、数据并行计算之后新的技术门槛。大数据结合现在被炒的火爆的AI算法,在互联网、零售、金融等很多领域建立起各领域的数据模型,随着数据反复验证,数据模型将会越来越精准,在行业中拥有行业理解、数据和算法迭代能力的公司逐步立于不败之地。
大数据和开源
在2016年提到大数据,不得不提开源的问题,2015年底Greenplum开源,2016年年初 Tachyon更名Alluxio成立商业公司,Kylin也成立了商业化公司Kyligence,还有很多过去开源的大数据组件都相互效仿纷纷商业化。一方面,开源的确在大数据普及过程当中功不可没,另一方面,开源在企业大数据应用过程当中添加了非常多的不确定性。每个企业的管理者都很难为不确定的结果买单,因此开源组件的商业化是一个市场转化的必然。
但是,大多数开源组件在中国都会遇到当年软件在中国售卖的难题,客户总认为硬件值钱、软件不值钱。解决方案是软件需要集成方案一起售卖,只不过新时代下集成商越来越难做,具有大数据集成能力的公司和团队还是太少。
当然,令人欣慰的是,华人在大数据开源组件和商业化过程当中影响力越来越大,像Kylin一样的Apache金牌项目在未来也会越来越多,也希望国内企业和政府给国内大数据企业更多的机会,让中国的大数据企业能走向世界。
传统公司的“互联网化”和互联网公司的“传统化”
在2016年,互联网+的概念依然火爆,很多传统公司在想着怎样利用互联网这个工具增加自己的收入或者估值。而另一个方面,从我的观点来看,互联网公司却在逐步的“传统化”。互联网公司初期的红利得益于新一代互联网技术的发展,萌生BAT这样以产品技术为驱动的巨无霸的公司。
但是随着新兴技术的成熟,一方面,每个“技术驱动”的公司都在用自己的技术搭建类似的业务平台,重复制造车轮;另一方面,重复制造车轮的开发者也在企业内部遇到了成长瓶颈。最近从大互联网公司出来的大数据和周边技术创业者屡见不鲜,利用在互联网公司海量数据处理的经验给其他公司提供服务成为VC最常见的case。
和我交流的创业者都知道,我个人非常欢迎这种“组团”的服务,我认为无论是否是互联网公司,一个企业应该做最擅长的技术部分而不是一揽子都做,过去因为技术不成熟只有自己摸石头过河,技术组件成熟之后完全可以拿来主义。
因此,在易观核心技术是围绕在数据采集、接收、并行计算和算法方面,周边的运维监控、查询引擎我们都在积极寻找合作伙伴来加快易观整体的产品技术的研发进程。如罗胖的跨年演讲中提到,适合的分工协作,从小讲为企业和个人节约时间,从大讲为整个人类节约时间。我持有不要重复造轮子的理念,让企业内专业的技术人员可以更多的分配到更适合的工作上去。
大数据将走向何方?
在2016年,我一直思考这个问题。过去在我的概念里,把(大)数据,分为1.0,2.0,3.0几个阶段:
1.0阶段是企业ERP/CRM时代,主要面对的是企业内部的结构化数据,使用者主要是公司管理层,大部分数据解决方案是BI、A-CRM一类的解决方案;
2.0阶段是互联网的大数据时代,主要以用户网络行为非结构化的log为主,使用者不仅仅是公司管理者,也包括了线上的用户,数据解决方案包括推荐引擎、个性化营销、欺诈识别等;
3.0阶段是 IoT/O2O阶段,通过智能的采集设备,将用户线下的行为轨迹,生理健康特征等采集起来,解决方案包括线上线下结合的客群画像分析、网点/交通/城市规划、定向营销等。
下一个数据应该走向何方呢?我在2016初步有一个结论,从1.0的交易流到2.0的线上行为轨迹流,到 3.0的线下行为轨迹流,数据距离消费者距离越来越近,对业务的影响也越来越大。从种种迹象表明,未来数据4.0时代将会是用户意识流的数据分析。
随着大数据和AI的发展,计算机可以采集到越来越多的人们线上线下的行为,通过AI的算法先从用户的所在的场景分析入手,开始建立场景引擎,分析给出用户此时此刻此地的需求。再从用户日常行为与习惯结合用户的生理特征分析用户所处的情感状态,赋予合适的心情诱导与抚慰。最终分析用户的心理需求与诉求,建立心境引擎将用户的意识与潜意识构建模型,帮助用户解决心理问题、给出或诱导用户得到符合用户心理预期的服务。我想,达到这一步的时候,大数据才会完美的和AI结合在一起,AI才会由“人工智能”变为易观CEO于揚先生提的“拟人智能”时代。
最后,根据自己在易观的创业经历,给大数据创业者的几个建议/忠告:
易观的市场VP李智在2016年新年的时候,送给了我一本书《缤纷的海洋》,读过之后非常有感触。每一个海洋物种都有它天然抵抗海浪以及天敌的特性,也和其它物种一起产生某种协同,从而生长出如此缤纷美丽的海洋世界。
仔细想过之后,这些海洋生物不就是现在创业大潮当中的创业者么?在复杂的社会变革环境里,大家各怀绝技,创造出纷繁复杂的企业生态,无论生存或死亡都给这个社会的大海留下美丽的创业生态群落。作为一个10多年数据的从业者加盟到创业环境当中摸爬滚打1年了,对于大数据的创业者有几个心得想分享给大家:
1. 勇于调整和决策
创业者面临的环境远非大企业的环境所比,无论资金上和团队上都会有极大的挑战,就像是打德州的锦标赛,筹码本不多,一个极小的错过或失误都可能导致整体的牌局的失败。
回顾2016年,无论是从公用云迁移到自建的混合云,还是将研发团队中心调整到长沙,又或是产品方向的调整,这在过去大型企业里看来都是一件不可能完成的事情(需保证公司每日过百亿数据量几千万日活的数据分析业务),但是回顾当时如果没有管理团队的果断决策,恐怕也不会有后面顺利的融资,这里非常感谢易观CEO于揚先生给我的指导,受益颇多。每个创业者其实都是穷其所能在关键时期将过去的不可能事情成为可能,才可以在复杂的商业环境中脱颖而出。
2. 要组团而不是单干
大数据最近非常火爆,投资也源源不断。在做大数据创业的时候,无论公司是小是大往往有一个误区,认为花时间找到团队可以做到大数据端到端的解决方案,一个公司独立完成对一个客户的所有需求的交付。这是一个误区,哪怕强大如当年IBM,Teradata,HP这样的公司,也无法完成这样的宏愿。
目前国内的大数据创业公司也应该根据自己的特点选择一个专注点直接击穿,其他选择合适别家公司的生态组合,最终满足市场的的需求。
个人也是如此,我见识过太多的小伙伴或者小团队抱着满腔热情准备创业,大部分都会铩羽而归,不是技术不好或者商务不好,需要的是个人之间的组团和企业之间的组团才可以在大数据热潮当中立于不败之地。
3. 要忽悠更要实操
大数据最近过于火爆,出现了很多能说不能做的公司,最终使得大数据很多时候和“大忽悠”画上了等号。作为一个多年数据业务的我来讲,有时候也觉得挺悲哀。
一方面,国内很多企业认知数据价值和数据分析价值时,需要市场培育的时间,“忽悠”在某种程度上是必要的,这样才可以让企业管理者反思自己的需求,投入资金不断尝试。而忽悠过后的落地和实施更加重要,只有让企业实现业务价值才可以让数据分析成为一个可持续的生意,而不是一场“大数据运动”。只有技术或者只有业务方案都不能成为一个完整的大数据解决方案,需要对业务本身的深刻理解加上过硬的技术和落地实施能力才可以帮助企业通过数据提效避险。
2016年已经过去,2017年已经到来,新的一年,我会依然坚定不移的走在追求“数据灵魂”的道路上。我不知道人类“意识大数据”的时代何时可以到来,但是我相信随着人类生活的数字化,AI算法的不断精进,总有一天人类无法看清自己的事情会让数据和AI算法看清,在那时,苏格拉底的那句名言“认识你自己”将会是大数据辅助你来完成。
最后,祝各位在数据前沿拼搏的战友们今年算法精进,数据大成!
郭炜,现任大数据分析公司易观CTO,负责公司的技术架构以及开发者生态产品研发、生态市场运营工作。加入易观前,曾任联想大数据总监、万达电商数据部总经理。
推荐阅读:
注:本文由 郭炜 投稿数据猿发布。
欢迎更多大数据企业、爱好者投稿数据猿,来稿请直接投递至:tougao@datayuan.cn
推荐阅读:
普丘信息系统COO陈涛:智能零售行业客户数据应用的思考与实践
TalkingData首席布道师鲍忠铁:我眼中的大数据产业2016年终总结