查看原文
其他

别被数据带进沟里:这才是应用数据的正确姿势!

彭耀 大数据 2019-06-23

导读:尽信数据,不如无数据。


你以为数据能够告诉你一切?其实如果你不能用正确的姿势运用数据,很可能会被它蒙蔽,做出非常危险的错误决定。


你对数据的把握、了解,决定了你如何利用数据来改变认知。阅读本文的4个案例,看看谷歌、领英、Netflix等明星公司是如何运用数据驱动决策的。




案例01 Airbnb数据驱动认知的故事


Airbnb是一家数据驱动的公司,但是Airbnb并不是完全靠数据来指导整个工作,他们是先以认知为主导,提出一个假设,基于这个假设,做出一些功能,上线通过A/B测试等方式来验证这个假设,然后不断的重复这样的验证驱动。


这种不盲目用数据来指挥决策的方式,是依靠人的直觉和认知来做主导,数据验证为辅的模式来驱动。因为在数据中发现的规律,不一定是代表正确的规律,有时候通过小数据发现的规律,再用大数据的分析方式来验证,可能会更有效果。


人的认知与数据分析是互补的,认知依据小数据可以发现情感、人性、感性所决定的规律,但是数据分析不一定发现得了,数据分析通过算法与计算,可以发现人思维触及不到的地方。


Airbnb认为,如果没有经过足够样本的测试,数据就有可能会误导人,所以有了想法和假设之后,就要去真实世界尝试,并发现数据来证明这个假设。


在Airbnb,鼓励每一个员工都能够做出新功能,新员工第一天就可以发布自己的新功能,并测试这个功能是不是有效,鼓励员工把想法实现成功能,再为功能做好测试。


Airbnb 以前仅仅是发布房子,寻找房子的功能,对用户来说黏性还比较小。Airbnb 在 2011 年夏发布“社交关系”功能,允许用户在 Facebook 上发布房源照片和链接。这个功能还能显示朋友和房东共同社交关系,2011 年 Airbnb 发布该功能时,用户里已有 16516967 对“关系”。


2012 年夏,Airbnb 更新之前的“心愿单”功能(Wish Lists ),一个月后,45% 用户使用了此功能,共创建超过 100 万清单。


▲Airbnb“心愿单”功能


“心愿单”功能因为在之前已经有了,团队希望了解,心愿单是否有助总预定量增长和优化?心愿单按钮以前是星形形状,大多数网站都是这种星形,有一个员工建议把星形改为心形,有可能效果会更好。于是,将房源照片上原“星星”标记,改成“爱心”心形标记,上线之后对该功能进行测试,发现一段时间之后,这个小的优化,将收藏功能提升了30%的使用率。


“心愿单”是用户内心的一种愿望,他们创建“好想去住蒙古包和城堡”这样的清单,并不时点开浏览。最终和 Airbnb “社交关系”功能一样,“心愿单”让其更具差异性,超越了一个“仅用于寻找住宿”的应用,并拓展了 Airbnb 的探索属性。


这是基于数据驱动的一种探索方式,无论想法是多么科学,都应该在数据系统中得到验证,因为数据有时候是用户真实行为的反馈。



案例02 Netflix以数据驱动产品


Netflix成立于1997年,是一家在线影片租赁提供商。用户可以通过PC、TV及iPad、iPhone收看电影、电视节目,可通过Wii、Xbox360、PS3等设备连接TV。比较知名的例子就是Netflix,通过自身大量用户行为数据,发现用户喜欢的热点,投资拍出了超级火热的电视连续剧《纸牌屋》。


Netflix是以数据驱动来打造产品的公司,数据分析的理念已经成为Netflix的企业文化。Netflix称之为消费者法则,最主要的目标就是通过创新提高用户体验。


Netflix采取的方法,就是依据线下传统的科学方法进行A/B测试,然后再通过线上测试来验证。这种想法的具体思路是:


1、提出一个假设。


假设一个设计、功能、算法能够提高用户体验。


2、设计线下测试。


通过MVP或者研发的方式,做出方案或原型。


3、线上测试。


4、让数据说话。


在做线下A/B测试的时候,Netflix会抽出几千或几万的用户来进行测试,并把这些分到10到20个单元中,然后对这些单元平行检测,通过A/B测试来驱动数据分析工作,来检验创新的想法或者思路,是不是会被用户所喜欢。


如果线下测试支持了想法或者假设,就可以实施在线用户测试。只有通过这个在线测试的假设才能够在系统中进行实施。


Netflix就是依据自己的大数据分析能力,来决策拍出纸牌屋。


作为世界上最大的在线影片租赁服务商,通过数据分析,Netflix发现用户很喜欢Fincher(社交网络、七宗罪的导演),也知道Spacey主演的片子表现都不错,还知道英剧版的《纸牌屋》很受欢迎,三者的交集表明,值得在这件事上赌一把。


▲Netflix首部原创电视剧《纸牌屋》


于是Netflix花1亿美元买下版权,请来David Fincher和老戏骨Kevin Spacey,首次进军原创剧集就一炮而红,在美国及40多个国家成为最热门的在线剧集。


国内的主流内容推荐引擎(无论是信息、短视频还是视频)相比,通常采取以用户为中心,根据用户浏览、收藏、付费等行为来建构个性化推荐体系,而Netflix以内容特征为中心,来分析不同内容可以推荐给谁,如何推荐,甚至是否要调整内容。



案例03 领英的数据驱动经营


LinkedIn(领英),全球最大职业社交网站,是一家面向商业客户的社交网络(SNS),成立于2002年12月,于2011年5月20日在美上市,总部位于美国加利福尼亚州山景城。领英2016 年被微软以 262 亿美元收购。


LinkedIn的CEO Jeff Weiner每天早上都会看一份每小时更新的数据报告,从报告中他能迅速了解到业务的现状,一旦发现问题就立即发给业务团队寻求解答。同时,LinkedIn整个高层对数据都非常敏感。


▲LinkedIn CEO Jeff Weiner


围绕数据分析来打造产品,也是领英公司的企业文化,领英的数据驱动,是如下步骤:


1)分析数据。

2)依据分析结果,优化产品。

3)依据分析结果,建立营销方案。


领英的数据分析,是从数据来驱动的,然后通过人来发现新认知,再依此来完善产品,以及建立营销方案。这种数据驱动认知,和以认知主导数据验证的思路不同,但是核心都是互相验证。


例如,2004年,领英对自己的用户来源渠道进行分析,发现从谷歌搜索来的用户,是电子邮件邀请来的3倍。领英决定不再去关注邮件获取的方式,把主要精力放在优化搜索带来用户的体验,这样一转折,6个月以后,每个月的用户数都保持了60%的增长速度。


然后通过分析用户留存,发现从搜索来的用户,特别关注用户的简历,于是就做出决策,不断的诱导用户完善简历。


再分析用户的黏度,用户注册第一周以后,需要增加5个社交关系,这样的用户带来的价值,是低于5个以下社交关系的用户的3倍以上。于是,领英又大力推广自己的产品,提升用户在第一周内增加用户几个社交关系,不断提高用户的留存率。


数据本身中就存在着规律,无论数据求和、平均、还是占比、同比、环比、统计值等,或者利用数据挖掘的各种算法,例如聚类、分类、回归、或者深度学习算法,都能发现数据中隐藏的规律。但一般发现的都是相关性的关系,还需要依据认知找出因果关系,有了因果关系,行动上就会有抓手。


所以数据和认知,是需要互相配合,才能找到更好的解决方案。



案例04 Gmail 团队再造 Inbox的故事


电子邮件已经发明数十年了,各厂商几乎“江郎才尽”,邮件厂商的产品一直没有太大的变化。


大约在2012 年,Google Gmail 团队决定为 Gmail 打造一款独立应用,为此团队对 Gmail在设计上进行大幅改版。如同所有Google的产品一样,它在正式推出前会先在内部进行测试。


这款改版后的 Gmail 在 Google 内部引起了轩然大波,Gmail 收到了大量吐槽的反馈,诸如“你们毁掉了 Gmail”,“你们这些疯狂的设计师在想些什么?”,“你们(Gmail团队)完全破坏了Gmail!”


Google的工程师为了阻止Gmail团队的决定,写了很长的帖子并发布在内部的Google+和论坛上,他们详细说明了应用中每一个改变的地方都不应该被改变的理由。因为改版太激进了,不少谷歌人每天经常用到的功能都被删除了。


为了平息内部的争议,Gmail 团队的负责人做了一次“你不是用户”的演示, 通过大量用户数据来说明改版决策的原因。


1)一个普通的谷歌人(Googler),平均每天会收到 450 封邮件,其中大部分不仅需要阅读,而且相当一部分还需要回复。


2)一个典型的大众用户,平均每天收到 5 封邮件,而其中大多数只是推广邮件,并不需要回复。


之所以去掉一些功能,是因为这些用户从来都不使用它们,而谷歌内部的用户并不代表真正的用户群体。而且这些功能,会让产品变得非常复杂,大部分用户只需要一个简单的邮件客户端而已。


如上的回复,虽然是基于事实的数据分析,但依然没有平息内部激烈的矛盾,谷歌工程师自己需要利用这些功能应对日常的大量邮件。


最后达成妥协,Gmail 仍然面对庞大的用户群,但是要保持精简,一些更高级的功能被隐藏起来。同时,Gmail 团队开始打造一款针对每天处理大量邮件的高级用户的产品,这就是今天的 Inbox。Inbox发布之后,市场反应出奇的好。用户觉得惊艳到感觉不像谷歌出品,同时,为了专业用户提供大量方便好用的功能。

 

▲Gmail团队再造的邮件系统Inbox


Inbox的决策来源,是数据分析结果的支撑。数据不是一切,也不是唯数据论,但是数据呈现了客观事实,虽然有时候可能不完备或者局限,但是利用数据,以避免被过去的认知所误导,帮助科学决策。



总结


管理者有丰富的经验,有丰富的想象力,这些都是优势。但是面对不确定的环境,管理者的成见、偏见,包括意识的推理,以及经验的局限性,尤其是管理者个人的倔强的脾气、倔强的执念、倔强的傲慢、倔强的贪念等不科学的方面,都有可能导致决策和现实有巨大的出入。


例如管理者的贪,体现在想快速获得推广,快速获得大规模营收,而忽视产品所在阶段;管理者的傲慢,体现在对自我观点的自负,为了证明自己,而做出不科学的决策;管理者的执念,个人的妄想,导致产品在不正确性方向上的巨大投入。这些都是管理者个人的局限性,往往会影响产品的大局。


因此,管理者需要建立数据与认知的双轮驱动机制。建立数据驱动的分析文化,用数据和自己的认知互相验证,互相检查,以避免自己走入误区。如果已经有一个好的想法或认知,那么根据这个认知来快速构建一个最小可行化产品,针对这个产品,需要做验证,获得数据,了解和学习数据,再形成新的认知和想法。周而复始的循环,不断验证整个产品的进展。


▲构建、验证、学习的循环


为什么要建立数据驱动的验证循环,是因为管理者认知与现实之间,有三层隔阂,而数据验证可以发现隔阂,让认知与现实更加吻合。


1、幻想与现实的隔阂。


管理者有自己的丰富经验,而且会有自己独到的认知,这是好的一面。坏的一面,就是管理者,对自己的产品都有一种情结,有创业情结、职业情结、产品情结、梦想情结等,这些会让管理者陷入认知陷阱。


管理者对自己的认知一般都很坚持,而且很自负、自傲,因为他们至少在某方面是专家,所以越是这样,他们越容易坚守自己的观点,尤其是有时候是错的,但自己并不知道。


当局者迷,需要一套数据分析系统,依据数据来调整认知。管理者需要设计出各类试验与假设,并用数据来验证这些认知的正确性。


2、虚假繁荣数据与客观数据的隔阂。


数据是来自事实与客观世界的反馈,数据本身没有问题,即使建立了一套数据分析系统,能够观察到各类数据分析的指标,但是人们看数据,依然会带着有色眼镜来看,符合自己内心期望的就会加强,不契合的就不会关注或者弱化。


很多指标可能会给团队带来很多自我假象,以为发展非常好,但是实际上都是虚假繁荣的数字,例如点击量、访问量、页面浏览量、独立访客数、粉丝数量、下载量、网站停留时间、用户邮件地址这8个指标,这些指标都是一种原始指标,他们并不代表什么,但有可能会造成虚假繁荣的现象。


例如1000个访问量,是10个用户访问了100次,还是1000个用户只访问了1次,这种意义完全就不同了。1000个点击量,这个点击量是多少人次的点击。下载量增加了,后面增加了多少新用户?


3、当前指标与行业标准的隔阂与差异。


管理者可能一开始找不到自己要关注的指标,也不知道这个指标应该到底是多少才是科学的。


一般一个在线零售商,其转化率在2%左右,如果能到10%就非常不错,大部分转化率在0.5%左右。根据研究,65%的访客会遗弃他们的购物车,其中41%是因为还没想好买不买,25%是因为价格太高。


一般SaaS服务商,争取每年获得20%的客户销售收入增长,争取每个月让2%的用户增加他们的付费额。在优化方面,争取将每个月的流失率降低到5%以下,否则说明产品的用户黏性不够好,如果能降低到2%,证明产品的黏性很不错。


媒体网站,大部分站内广告的点击率在0.5%到2%之间,如果低于0.08%,说明有问题。


用户制造内容网站,如果访客在你的网站每天平均花费17分钟,证明黏性较好。25%的访问者会潜水,5%到15%的用户会制造内容,而这些参与制造内容的人中,80%的内容来自一小部分极度活跃用户,而只有2.5%的人会参与内容互动。


针对免费移动应用,65%的用户会在安装后90天内停止使用该移动应用。


关于作者:彭耀,象形科技联合创始人兼CTO,典型的产品型和技术型管理者。资深的大数据专家、人工智能专家和产品专家,有近20年的开发和产品经验。

本文摘编自《升维:争夺产品认知高地的战争》,经出版方授权发布。


延伸阅读《升维:争夺产品认知高地的战争》

转载请联系微信:togo-maruko

点击文末右下角“写留言”发表你的观点


推荐阅读


汶川地震10周年:大数据正在攻克地震预测这个“不可能任务”

大数据没用?!张小龙:我们很少看统计数据!

Python爬虫新手进阶版:怎样读取非结构化网页、图像、视频、语音数据

数据告诉你:跟缺“芯”相比,中国当前的这个问题更致命!



Q: 数据与认知的关系,你明白了吗?

欢迎留言与大家分享

觉得不错,请把这篇文章分享给你的朋友

转载 / 投稿请联系:baiyu@hzbook.com

更多精彩,请在后台点击“历史文章”查看

点击阅读原文,了解更多

    您可能也对以下帖子感兴趣

    文章有问题?点此查看未经处理的缓存