查看原文
其他

【九合专访】所问数据颜鹏:我在做中国第一家严格意义上的大数据公司

2016-05-23 九合创投 九合创投



颜鹏,1984年,山东人。所问数据创始人兼CEO,美国North Dakota State University计算机博士,曾在3M公司任高级研究科学家一职,负责海量数据的建模与分布式计算。去年12月6日,颜鹏正式回国,与3M同事丁圣超一起创办所问数据,致力于通过全球最顶级的智能预测算法,帮助企业激活内部数据价值,真正实现用数据驱动决策。2016年初,所问数据获得九合创投天使轮投资。





“了解的越多,越迫切把这个事情做出来”

 

从在3M做高级研究科学家时有创业的想法,到12月6日回国,颜鹏花了两年的时间,筹备到80%时,他觉得这件事“实在不能再等了”

 

这也符合投资人第一次见他时的印象:“急切想做事的心情,放弃等绿卡,让老婆带着8个月的孩子回老家,在北京直接租房子开始干。”

 

颜鹏至今都还记得很多这样的时刻:2014年12月,ThreatStream(加州著名的网络安全公司,以智能角度对抗网络安全威胁)宣布获得完成 2200 万美元 B 轮融资,“当时我和同事还在开发阶段,听到这个消息,那种自己掌握了可商业化的机器学习核心技术,但还没下海的感觉,心里想着一定要快点做出来。”2015年10月,Everstring凭借其在预测分析方面的成功应用,获得6500万美金B轮融资,这些都是人工智能在商业领域创造实际价值的典型案例。他还记得,15年上半年,参加各种供应链会议时大家都还在讲概念,但下半年再去的时候,看到的都是实实在在的案例和demo,“但我知道,他们做的都没我们好。”

 

除了对技术壁垒的绝对自信,这种“不能等”还来自于他对市场的考察。接触大数据六年,在3M当高级科学家两年,颜鹏回国考察了三次,线上和线下零售的销售环节有哪些、物流怎么运作,需不需要预测,人为干扰多大,订单议价权在谁手里,哪些行业是容易标准化的,哪些是需要深度定制的……这些都是决定创业前必须考察清楚的问题。

 

他深刻意识到,在美国,数据驱动决策已相对成熟,大数据行业的需求已从计算从应用场景倾斜,应用场景的切入和对接能力开始接管产品的核心竞争力;但与之相比,中国仍然是个“经验至上”的社会,后端供应链和前段销售脱节,生产多少完全根据过往经验来定,卖不出去压仓库,成本负担越来越重,大量的企业利润被物流吞噬,而且企业越大,风险越高,不当的决策甚至可以给企业造成毁灭性打击:以服装行业为例,全中国服装业的库存高达5000个亿,这就意味着如果现在一件衣服不生产的话,可以在市场上卖五年。

 

中国绝大多数的公司尽管已经意识到了这一点,他们也明白,进化宜早不宜迟,但推翻原有“还算够用”的技术基础系统,从粗糙的“拍脑袋”做决定到从上到下建立一个真正数据驱动的文化,并非易事。而这一切,都是因为目前国内还没有人能实现足够精准的数据挖掘和预测,大型企业还是会小心谨慎地让年轻的创业公司处理他们基础设施中如此关键的部分

 

精准预测,正是所问数据核心的竞争力。所问数据的第一个客户是茵曼,“当时最先只给了我们3万个SKU样本数据做初步预测,最后结果出来,我们预测的结果平均每个SKU的误差在36.3-36.7件中间,这个结果的准确度,扎扎实实地打消了客户的顾虑。”

 

今年三月份,颜鹏连自己的生日都忘了,但他还记着的是另一个数字,三分之二。“有统计说,三分之二的独角兽,创始人都是第一次创业。”颜鹏想对标的,是硅谷知名大数据科技公司Palantir。所问数据的两套拳头产品,也在切切实实的对标Palantir的两款核心产品。

 

用技术带来价值:我们目前的技术是全球第一

 

“现在中国所谓的大数据公司,严格意义上来讲都是云计算公司,大多数人都是在炒概念,做的并不是大数据的事。”聊起大数据在中国的现状,颜鹏下了这样的定论。“因为大数据的终极目标是预测未来。”随着越来越多的数据被记录和整理,未来预测分析必定会成为所有领域的关键技术。

 

他提到,目前中国大数据企业做的事,一部分是数据收集和清洗,一部分是数据可视化,而涉及到大数据最核心价值的中端,即如何通过模型和算法来实现信息挖掘和有效预测,国内还尚未有人真正在做,“因为这部分技术壁垒最高,也最难实现。”而这正是颜鹏选择回国的原因。“我有这个自信,我们目前的技术可以达到远高于同类解决方案的预测准确率,是全球第一。”

 

所问的预测算法具有自适应自学习两大特点:所谓自适应,指的是可以自动的选择最优的算法进行预测而无需任何人工干预;所谓自学习,指的是算法会基于上一次的预测不断的自我学习和自我优化,用户使用产品的时间越久,获得的准确率就越高。此外,所问团队还开发出了全球首创的深度推荐(Deep Recommendation)算法,进行产品的深度推荐和销量影响因子的深度挖掘,能够帮助传统零售商、制造商、电子商务网站企业揭示数据背后隐藏的规律,提前预判市场变化进行相应资源规划,进而极大程度有效降低运营成本。在金融业、医疗、政府事务等方面,所问团队也拥有极其丰富的数据挖掘、分析和系统部署经验,并且正在利用其核心预测算法为某市政府部门进行经济运行分析的监控和预测。

 

所问选择的切入点是解决供应链管理中最核心的库存问题和帮助企业打造爆卖产品,“以服装企业为例,想知道下个月卖多少,明年卖多少,想知道为什么有些衣服卖成爆款,而有些衣服走的不好,从数据科学的角度,我们能把你想知道的信息全部告诉你。”而实现方式,则是通过在供应链端和销售端建模,根据企业过往的销售历史和实时市场行情,外部数据(如经济数据,天气数据等)与企业内部数据相结合,来实现精准预判。

 

“很多问题是可以通过技术解决的,你能用技术真正为企业、行业创造价值的话,肯定能成。”颜鹏说。

 

团队:从2个人到11个人 心里越来越有底

 


所问团队


从12月份只有两个创始人,到现在扩充到11个人,手头运营着4个项目,此外还有多家慕名而来的客户,其中不乏A股上市公司已在排队,颜鹏说,自己的心里“越来越有底”。

 

3年前,颜鹏博士毕业,摆在他面前的OFFER,一个是去FBI继续从事数据挖掘工作,这与他读博期间一直跟随导师做的反恐项目息息相关;另一个则是去3M担任高级研究科学家,负责海量数据的建模与分布式计算,颜鹏选择了后者。

 

在3M,颜鹏认识了后来一起创办所问的CTO丁圣超,丁圣超之前是美国加州大学圣地亚哥分校博士后,中科院计算所计算机博士,1999年武汉大学理科状元,具有极其丰富的预测型数据分析和深度学习算法经验。“当时组里只有三个中国人,我俩聊得比较来,都是想干一番自己的事业,想对自己做的事情更有把控。圣超是科学家,我更偏工程师。”在美国工作的业余时间,两个人便开始利用各自之前的研究经验开发所问目前精准预测的模型和算法。“所有心血都在技术方面,得先把东西做出来。”

 

2015年7月25日,颜鹏发了这样一条朋友圈:“凌晨四点四十分,通过!B2B时代——数据的时代——data miner的时代!”12月6日,美国的房子和车子还没卖,颜鹏就回了国。第二周,两人开始找投资,招人,“5个月面了100多个,招了9个,我最看中的是,面试者是否真正认可我们做的事情的价值,是否会把这件事当做一份事业来做。”所问的三号员工,一个有七年工作经验的工程师,目前已是技术顶梁柱,父亲来北京两个礼拜,都没回家睡过觉,一直睡在办公室。

 

上一个周末加完班,颜鹏组织大家出去玩了一次,吃饭,唱歌,“发现这群技术宅其实也都挺多才多艺的,有一个工程师唱粤语歌还唱的特别棒!”那天回来后,颜鹏发了一条朋友圈这样写道:“让我们兑现自己的理想,做中国最牛的大数据公司。”

 

“通过数据,你真的能看到很多别人看不到的东西”

 

回国创业半年,颜鹏每天只睡三四个小时,瘦了十几斤。

 

九合是颜鹏回国见的第一家投资机构,见了两次,就拍了板。“说是找投资,其实一直是在聊技术,因为都是技术出身,骨子里都是工程师,沟通成本很低。”颜鹏说,虽然已经有了开发好的模型和算法,但在回国前从融资到业务,还是做好了最坏的打算。“比想象中要顺利,在正式签合同前,就以借款的形式打来了50万,注册公司,买服务器,租办公室……一项项做起来。”

 

早期的几家客户,都是颜鹏一个个去南方跑下来的,回国三周,跑了八个城市,这也是投资人看中颜鹏的一点,“在跑客户的过程中可以找到做产品的方向和感觉,减少产品的试错成本。”作为一家纯技术壁垒公司的CEO,不仅要具有黑客的头脑,对数据有好奇心,还要对商业有热情,是能跟人打交道、能解决问题的人。颜鹏至今还记得,博士第二年去一家创业公司帮忙,做最流行的VR,技术很牛,但公司最后还是死掉了。“因为我们做在了PC端。”这次经历给了技术出身的颜鹏一个最大的教训:“技术再牛,不能做脱离市场的东西。

 

在美国六年,颜鹏就去电影院看过两次电影,“我记得有一部是《变形金刚》,老婆说,都快回国了,看场电影再走吧。”选择把孩子和家人都放在老家,自己一个人在北京打拼,颜鹏调侃:“再不回去,儿子都不认识我了。”但他常说,做出创业这个选择,是顺势而为,是命运推着在向前走,是天时地利人和。

 

——“不创业的话你会干什么?”

——“不在中国创业的话,我会在美国创业。”

 

他提起自己上大学时,写过好多好多诗,还想过寄给方文山。骨子里,颜鹏仍觉得自己是个工程师。他经常回忆起在美国读博期间,有无数个夜晚,晚上都回家了,突然想起个什么东西来,晚上两三点骑车回实验室去改。“你知道吗?特别有意思,通过数据,你真的能看到很多别人看不到的东西。




您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存