查看原文
其他

大数据与用户研究

陈新涛 三生万数 2020-09-13

2017.10.25 受天津师范大学所邀,前去给「用户体验」专业的研究生同学做了一个关于企业中如何研究用户的分享。为讲述方便,我便在开篇处简单地讲解了用户与当前互联网企业的关系,并总结分享了之前在美团,GrowingIO 和转转总结的用户分析方法论,同学间反馈还算良好。在这里分享给大家。


整个分析框架从「WHY-WHAT-HOW」入手,拆解为以下内容:

  • WHY:为什么要研究用户,为什么要用大数据

  • HOW:企业如何使用这些数据

  • WHAT:互联网企业研究用户需要什么数据



1. WHY:为什么要用大数据研究用户

当前情况下,用户的总使用时长,及移动互联网的新用户的增长均已经到了瓶颈。正如 Questmobile 2017 年秋季报告提到的:

从 2017 年 1 月的 10.27 亿到 9 月的 10.64 亿,增长非常缓慢;从同比增长率来看也呈逐月递减的趋势,再次验证人口红利殆尽,移动互联网用户增长面临巨大考验的现状。

也正因于此,Growth Hacker 的概念才会在 2016 年开始火热起来。因为整个行业已经意识到,当初随手一捞一大批用户的日子已经一去不复返了。

PPT 中以 Facebook 的 MAU 增长情况为例,侧面证明用户对一个成功的互联网企业多么重要。

其实,不光是用户,对物理现实中所有客体及客体间关系的描绘和抽象,都逃不开大数据的利用。吴军博士在《智能时代》中提到,大数据应以「大体量,多维度,完备性」为主要特征。借助这些特征,它才会成为物理世界比特化的重要工具。以王坚博士在《在线》的一段话作为辅证:2. WHAT:互联网企业研究用户需要什么数据

在对用户的描述和还原上,以 5W1H 框架拆解,来回答「因为什么,谁在什么时间什么地点 采取什么样的方式 做了什么事情」。大数据在用户研究的应用,本质上就是利用数据,去描述上面的内容,从而还原用户当时当刻的使用场景。具体可落实到以下三个具体方面:

2.1 定位用户属性:Who

Who 可以拆解为「描述」和「统计」两层。「描述」从微观层面讲述用户是谁,有「基本标签」和「抽象标签」。「统计」则从宏观层面回答用户的数量和质量问题。


基本标签是可以直接获取的原生数据,不需要经过二次加工。抽象标签则是根据基本标签加上对业务的理解,进行抽象和加工,以便直接应用到业务中。

基本标签在这里拆解为「属性」和「行为」两类:

抽象标签举了三个例子,并着重讲明了它的特性:本质上是个概率区间且需要实时更新。因为再抽象,也只是猜测。是猜测,就有不准的可能性。

在以上标签的使用过程中,需要结合不同业务来判断需要哪些标签,能用哪些基本标签,以及能怎么用这些标签。比如对于社交类产品和购物类产品来讲,男女性别这个标签获取的难度和准确性就不一样,使用的手段也不一样。对于陌陌来讲,男女性别可以直接获取,并且可以作为推送给其他性别的用户的依据,非常重要。而如淘宝,更多只能从用户浏览的产品来判断,甚至有生理性别和购物性别的差异。而在使用上,则会用于对一些商品推荐上的考虑,不那么重要。

而在「统计」层面,可以利用一些常见的分析方法,与用户研究做结合。这里简单介绍其中四种。

2.2 定位用户属性:How,When && Where

漏斗分析和轨迹分析分别适用于目标用户群体有无明显操作顺序的情况。而日志分析适用于针对单个用户的操作分析。

漏斗又可以根据周期长短分为长漏斗和短漏斗。长漏斗涉及周期较长,在新用户归因,用户生命周期研究中多有采用。AARRR 本质上是对用户生命周期的长漏斗分析。

短漏斗在分析过程中,可以根据漏斗行为的每个过程做纵向分析,也可以根据漏斗切分的维度,做横向分析。以 GrowingIO 做的漏斗分析为例:

轨迹分析首见于 Google Analytics ,图形名为桑基图。当用户没有明显的操作顺序时,或者当需要研究各个页面间流转情况时,这种图便可派上用场。另外,在表达各种「主体多目的迁移」的场景下,桑基图也适用,如居民在各大城市间的迁移,电商用户在各大品类间的迁移现象等等。

日志分析,又可叫用户细查,是在对某个用户的操作路径分析,以覆盖前两种群体分析方法的盲区。以 GrowingIO 的用户细查功能举例:

2.3 调查用户动机:Why

这个目前在搜索产品的应用上,表现为用户的意图识别。不过当前以我所知的分析手段,猜测用户动机还是比较难的事情。如有朋友对这块有研究,还望不吝赐教。

3. HOW:企业如何使用这些数据

在如何使用数据方面,我按照职能和产品分成了两条线,并简单地挑了 CRM 和 个性化/产品质量提升 两点举了个例子:

3.1 用户运营系统-CRM


3.2 个性化引擎/产品优化


Google 在利用用户信息完善信息推荐上做了很多事情,举三个简单例子:

  1. Google 会根据用户输入的信息,给出建议的搜索内容,提高用户的输入效率

  2. Google Now 会根据你所处的位置,所在的地点,以及以往在此时的历史事件,自动给你推荐合适的内容。比如,在下班时,自动会给你推荐打车的 app 和打车回家的路线

  3. Google 的广告也是根据你平时搜索和浏览的内容,然后来推送广告。这是个三赢的事情

原先亚马逊是通过专家撰写书单来向用户推荐书籍的,后来有工程师默默地做出了一款推荐引擎,小流量上线后发现效果不错,后续就全面放开了。据吴军博士《智能时代》数据显示,现在亚马逊销售额有 1/3 来自于给用户的推荐(虽然我对这个数据存疑)。类似的,转转也有很多订单来自于我们的推荐功能。

最后给天津师范大学的研究生同学分享了几本书,两本是关于大数据的,两本关于用户体验。补充下,大数据本身只是个工具,用户研究有更广阔的分析手段可以采用。


做个「伪个性化推荐」,你可能也会喜欢以下文章


大数据产品漫游系列:

4年估值20亿美元的大数据公司:Domo的神秘国度 

秋毫明察,实时数据产品一览 

在数据产品这个行业里,你需要知道这些内幕

三个步骤告诉你如何设计高效Dashboard


数据 PM 专业技能系列:

数据产品必备技术知识(1):数据仓库之基本架构及ETL

华尔街日报是这样做数据可视化的(1)

互联网数据分析从入门到精通的书籍清单

数据分析的坑,都在统计学里埋过





*****作者简介*****

陈新涛,现任转转数据负责人,曾任美团外卖首任数据PM

转转是国内领先的二手交易平台,2017.4 获得腾讯 A 轮领投 2 亿美元

长按以下图片可关注本号,点击原文加入小密圈读者群


    您可能也对以下帖子感兴趣

    文章有问题?点此查看未经处理的缓存