【大数据专栏】崔晓波:让数据产生价值
【这是“大数据专栏”的推送文章,本专栏由中关村大数据产业联盟与科技杂谈合作提供】
文 / 崔晓波,本文为崔晓波在中关村大数据产业联盟“大数据100分”论坛上的交流探讨实录
主讲嘉宾:崔晓波
主持人:中关村大数据产业联盟副秘书长陈新河
承办:中关村大数据产业联盟
嘉宾介绍:
崔晓波:TalkingData(北京腾云天下科技有限公司)CEO,多年来专注于移动互联网、社会化媒体领域的数据分析,数据挖掘,和模式识别,对移动互联网行业发展趋势、产品技术演进有高度的前瞻性。崔晓波曾任Oracle大中国区A&C技术总监,BEA亚太区电信技术中心总监,拥有15年互联网/企业应用从业经验,是中国移动互联网行业的资深专家。
TalkingData(北京腾云天下科技有限公司)成立于2011年9月,是一家专注于移动互联网综合数据服务的创业公司。TalkingData目前为30000余款移动应用、游戏提供数据统计服务,覆盖7亿独立设备。
TalkingData拥有多条数据服务产品线,服务内容从基本的数据统计,第一方数据管理平台,到深入的数据分析、挖掘,可以为移动互联网企业提供全方位的大数据解决方案。
以下为分享实景全文:
崔晓波
大家晚上好,非常感谢新河的邀请,让我有这次机会和各位专家和前辈交流。
TalkingData,是专注在移动互联网领域数据服务的创业公司,我们品牌是2011年9月份创立,到目前为止只有两年半的时间,专注给整个移动互联网生态提供各种各样的数据服务,包括我们给开发者提供统计分析工具,我们给移动互联网上的渠道,像百度、金山、同步推等提供广告监测工具,我们给很多游戏公司提供算法,包括模拟仿真系统等等。希望今天是一个互动的交流,大家如果有任何建议和问题,我们都可以探讨。
以上是我们针对移动互联网开发者,提供的一些数据服务以及产品,在过去两年的时间中,我们的业务增长的非常快,这得益于中国智能机以及移动互联网市场的高速发展,我们只是搭了顺风车。
可能更为生活化的描述,大家理解起来更容易一些。从去年开始,我们注意到移动的应用已经走到人们的生活里。打个比方,可能你准备出行的时候,在家里用“去哪儿”去选择机票和酒店;出门用“嘀嘀打车”叫车;到了机场有一点时间,可能会玩一些手机游戏,比如“植物大战僵尸”或者“我叫MT”。或许女士有点时间会用“聚美”、“唯品会”买点化妆品;购物的时候,会用信用卡应用、银行的应用。实际上,你所用到的这些应用,都在使用由TalkingData提供的数据服务。
人们经常会问我们:“为什么开发者,特别是那些大的开发者会使用一个第三方的数据服务,而不是自建?”
首先,移动数据分析和互联网数据分析还是有很大有区别的地方。比如移动终端的时钟不准,我们刚创业时,收集上来的数据有很多显示1950年,1970年,后来发现是三星手机ROM的一个Bug。移动的网络不稳定,经常造成数据的标识丢失,需要有比较强的纠错算法来补偿。在移动端虽然有设备的唯一标识,但是很多国产手机,平板并不按照标准的接口实现,你提取到的经常是空值。这都造成了移动数据服务的一些差异和难点。
再给大家举个例子,比如给用户看目前某一个报表,从真正数据收集上来看大体是这样的。这里我们拿中国移动举例,在直接收集到的数据里我们可以看到“中国移动”、“中国移动”、“中国、移动”、“中国移不动”、“中国移动SB”……原因是什么呢?很多厂商都在ROM中乱写,不少热衷于刷机的用户也会自己改写这个标识。这个时候就需要有一个专业的第三方平台投入很大的精力人力帮助客户做标准化,这都是传统互联网不可能碰到的问题。另外,移动数据完全是在新的领域,它的业务模式会完全不同。
接下来我们看看在移动互联网侧到底能够提取到什么样的数据。
大家会看到其实包括了用户、设备、上下文、位置、行为等多方面的数据。
还有一种更简单的分类方法,按照数据的用途,大体有三大类:
第一种是基础信息,比如设备信息。用了什么设备?芯片是什么?用了什么运营商的服务?这些信息有用吗?有用,因为很多设备商运营商会购买报告,但是我们没有走这条路,因为在中国卖数据报告是不可行的,至少没有成功的先例,而且容易走偏。
第二种类型的数据就是与应用相关的数据,包括客户用了哪些应用?程度有多深?因为和很多应用商店合作,所以我们会交换到很多这种数据,这些数据很有价值,很多投行也会来问我们,那些上市公司应用情况到底是什么样的?在Android的排名到底是不是真的?其实我们都有,但是不会说——在这样的复杂的市场环境里面,没必要说。
第三种是客户行为数据,反应客户的消费倾向性、交易行为、喜好、位置信息,这些数据蕴含巨大价值,但这些数据价值的挖掘需要找到一种可行的方式,所以现在我们在金融领域大量尝试这种方法。
以下是我们的产品路线以及数据路线图,给大家参考一下。
赵晓庆:
@崔晓波你们做的是类似友盟的服务么?
正好回答刚才这位朋友的问题,我们刚创业是推出了一个AppAnalytics产品,这方面百度、友盟,以及我们的AppAnalytics的产品形态是比较接近的。
但从公司的定位和愿景来看,我们是完全不同的公司。首先TalkingData定位于中立的第三方数据服务平台,提供专业的数据服务,我们并不涉及上层业务,比如:渠道分发、广告投放、游戏发行、风控模型等。第二,我们更专注于如何利用数据产生价值,以及如何利用数据增值,而不是提供数据工具本身。所以我们创业第二年就推出了很多垂直行业的数据产品,比如游戏、电商、金融等数据统计分析产品。我们认为只有和具体业务场景结合的数据才是比较有价值的。
接下来谈谈我们对数据价值的理解,大家都知道移动数据很精准,可以Mapping到一个人,能够比较全面的反映比如喜好、习惯等行为模式。但是对于移动互联网行业来说,它其实更多的是数据供给方,除了游戏、广告等利用数据驱动或者优化的场景外,并没有强烈的需求。
而恰恰是那些传统的行业,如银行、保险、旅游、汽车、健康等,是数据的需求大户。所有我们老半开玩笑的称自己是“数据物流平台”,把数据输送到数据的需求方去。
袁昕:
@TalkingData崔晓波?你们的数据怎么来的?
崔晓波:
我们的数据30%靠自己覆盖了7亿设备的SDK采集,更多的是靠数据交换和交易而来,比如我们和大部分应用商店都有合作,我们与很多地图应用有深入集成、合作。
前几天,我看大家都在举银行业的例子,我也从这方面案例讲起。
首先我们从左图会看到,其实银行业的手机客户端是非常活跃的,月活跃的总人群可以打到3~4亿人左右。
对于金融业,面对金融脱媒的压力,移动渠道的构建与基于大数据的运营已经成为布局互联网金融的核心。目前,包含招商银行、平安集团在内,TalkingData的移动大数据解决方案已服务超过国内50%的股份制商业银行,以及工商银行等大型国有银行。帮助客户系统化梳理了移动大数据运营的需求及演进路线并基于自身的产品和数据为客户的移动金融战略实施提供核心支持。
以招商银行为例,掌上生活作为信用卡中心的主要移动渠道,在整个银行业的活跃度首屈一指,而最开始也面临着许多问题。缺乏系统的移动应用推广及运营方法,整体移动业务ROI比较低;缺乏有力数据追踪监测能力,无法及时量化衡量运营效果以及发现和分析运营问题;缺乏统一高效的移动关键数据采集,及加工处理能力。
而通过专业数据产品以及咨询方法的引入对于关键KPI的提升是非常明显的。月活跃度以及绑卡率都有2~3倍的提高。
另一个对于营销增强的案例,中信银行“异度支付”移动营销监测项目。
后来通过给平安、银联等金融企业大量数据平台实施案例,我们发现很多企业数据规划中的共性。
下面这张图很经典,大部分银行已经按照此图开始做相关规划。
在引入移动DMP平台后,大部分企业客户下一步会建立第一方DMP平台,将网站、社交网络、线下数据、CRM等客户数据做统一标示、管理,完成包括客户画像、分群、精准营销等业务功能。
根据我们保守估计,今年数据相关服务的市场机会还是比较大的。
结束语:我们是这么看移动互联网的。移动互联网本身的业态并不存在,最终它会和传统互联网融合,所以在传统的互联网跟移动互联网,包括传统产业之间需要一条桥梁。TalkingData认为数据是一个桥梁,帮助移动互联网企业在传统行业里面找到自己的盈利模式。由于时间关系,今天我准备的内容就到这里,欢迎大家有空来TalkingData做客、合作。
交流互动
袁昕:
目前你们哪个行业做的最成熟?
崔晓波:
我们目前还在摸索商业模式,TalkingData目前最专注的两个行业是游戏和金融。
陈志成:
统一的用户标识是很重要的,大家几年前都有这样的想法,但不同业务分属不同主管部门或不同运营商,导致其商业利益不清晰,始终未能有实质性进展。这方面崔总你们怎么考虑的,如何打破利益分割问题,真正建立起统一用户管理平台?
追逐自由:
刚才看了CSDN上的介绍,你们的发展历程很有参考意义!你也是BEA军团的骄傲,你在巴别塔的时候我知道你。后来在BEA的聚会上见到你的COO。
胥正川:
我认为贵公司的核心竞争力就在于大量移动数据的积累,并从中精准地为客户画像,不知道这种客户画像是如何产生的,使用了什么模型或方法,可以精准提取他的喜好。我仅从学理上关心,涉及到商业机密的部分,您不用回答我。谢谢!
袁昕:
你们的商业模式挺清晰,使数据产生价值。
崔晓波:
这两个行业通过数据融合方面我们做了很多尝试,最近我们对几家银行做了游戏玩家画像分析,发现用户群重合度很高,通过这个研究促进了利用银行积分在移动游戏端的消费,取得了非常好的商业结果。还有BEA老同事,一定来做客。
袁昕:
您觉得目前银行对移动互联网数据最主要的需求在哪里?
崔晓波:
目前其实直接对数据的需求其实主要在风控领域,由于互联网巨头的威胁,特别是微信信用卡,支付宝信用卡虽然被叫停,但是让传统银行看到了互联网公司有实时授信、实时开卡的能力。而传统银行审核周期长(7天审核,7天寄送卡片),基于FICO的平衡记分卡,资产类数据的模型已经不适用目前业务的高速发展。
袁昕:
实时放贷
尚硕:
没错,这也是我在思考的,包括统一用户标识,根据内外部数据源,通过很多细微的数据来分析用户的风险及授信额度
袁昕:
银行的用户数据也给你们?
崔晓波:
目前大多数银行都在测试、调整新的风控模型,这方面我们参与很深,很多数据是从移动互联网提供的,涉及很多业务机密,这里不方便透露太多,欢迎大家线下深度交流。
数音堂-楚人怀玉:
望尘莫及的卡位。
尚硕:
这个在操作中我觉得不绝对,资产数据与其他数据我认为是互补作用,而非替代作用。移动互联网端的数据在匮乏时,比如是一个较新用户状态,若是能够引入传统资产数据,对风控的支持非常有帮助。
崔晓波:
这个是这样,新的模式在前期更多的是辅助和参考。
曹力:
请问你们的SDK是怎么推广的,如何获取大量用户的
崔晓波:
SDK推广,中国和国外有很大差异,在美国只要产品口碑好,社会化传播就会有比较好的效果,中国还是需要BD以及线下推广的辅助才能取到比较好的效果。我们的经验是,树立行业标准,推广数据分析方法,再配以专业SDK效果最佳。
尚硕:
刚才说到的很多收集数据过程会有大量问题,我们自己也在做探针系统,但是如刚才所言,除去因网络、终端等引起的缺失数据外,还有大量安卓手机不规范的数据信息,全自己处理清洗,确实很辛苦。
陈志成:
如果SDK好用的话,可以通过搞比赛的方式来推广。
崔晓波:
一致数据指标定义,以及应用场景很重要,这是我们在行业中推广指标白皮书的原因。
尚硕:
自己做的好处是对自身业务更了解,一些特定模块的信息收集更容易处理。6亿的数字让人眼红。
崔晓波:
绝无水分,回头我会把指标白皮书电子版发给新河,让他转给大家,是个好的参考。
陈新河:联盟副秘书长;《软件定义世界,数据驱动未来》再次感谢晓波的精彩分享!晓波为了今天的分享,精心准备多日,为保证网速,专门到单位进行分享,再次表示深深的谢意!大家自由讨论吧!
【入中关村大数据产业联盟500人微信群指南】
您只需在中关村大数据产业联盟500人微信群中分享一次大数据思想、案例,即可进入500人微信群,与众多大数据朋友沟通、交流、合作!(入联盟500人微信群,请把代表您能力和水平的PPT及姓名、单位、职务、联系方式发chenxinhe2020@126.com。详情请订阅微信公众号:软件定义世界(SDX)后,查询500)
【中关村大数据产业联盟主旨与目标】
落实国家战略,聚合产业势能,促进商学互动,
助力企业成长,倡导数据伦理,探寻数字文明
【中关村大数据产业联盟活动】
〖大数据100分〗以500人圈大数据技术、资本、专家和政策专业人士为依托,每晚9点进行的线上活动。
〖大数据地平线〗以大数据执委会和中关村大数据产业联盟成员为依托,进行的走入企业现场调研活动。
〖大数据香山汇〗以“运动、分享、进步”为宗旨的爬山、PPT分享、研讨活动。
〖大数据沙龙〗以“数据驱动,创新未来”为主题的高端大数据沙龙活动。
【中关村大数据产业联盟联盟网站】
http://www.zgc-bigdata.org/
【大数据媒体方阵】
〖软件定义世界(SDX)〗、〖大数据文摘〗、〖大数据栋察〗、〖科技杂谈〗、〖CSDN〗、〖天云融创〗、〖大数据邦〗、〖199IT〗、〖大数据实验室〗、〖云里数里〗、〖中云网〗、〖云华时代〗、〖大数据问答〗等,目前已覆盖20多万订阅用户。
欢迎加入大数据媒体方阵,第一时间获得〖大数据100分〗等中关村大数据产业联盟提供的独家信息,请在公众号留言或加入个人微信号沟通。
【联系方式】
地址:北京市海淀区东北旺西路8号中关村软件园软件广场C座3层
电话:010-56380808
电子邮件:sdxtime@gmail.com
个人微信号:sdxtime
欢迎大家加入科技杂谈菁英汇,交流思想、分享信息。仅限行业商端人士参与。参与方式:点击左下方“阅读原文”填写您的加入信息,科技杂谈通过审核后,会添加入群。
本文仅代表作者观点,科技杂谈授权刊登。
转载必须注明作者与科技杂谈,侵权必究。
科技杂谈文章,均同步发布于犀牛财经网。
已入驻搜狐新闻客户端,网易阅读客户端。