今日头条、知乎、豆瓣的算法,藏着什么秘密?
内容来源:算法与内容推荐分发系统科普书,厘清算法逻辑,讲透内容推荐分发系统。本文为中信出版集团书籍《内容算法》读书笔记。笔记侠作为合作方,经授权发布。
作者简介:闫泽华,简书签约作者。知乎知识市场产品总监,前今日头条资深产品经理。
封图设计 | 泉十七 责编 | 浮灯
第 2412 篇深度好文:6623 字 | 9 分钟阅读
读书笔记·产品运营
本文优质度:★★★★★ 口感:海陆披萨
笔记侠说:
今天,国内至少有4亿手机用户通过算法获得内容,国内内容创作者群体半数以上流量来自内容推荐系统。
未来,算法推荐可能会成为互联网公司的标配。
对于所有与互联网内容产业相关的人来说,了解算法与内容推荐系统势在必行!
对于算法分发很多人会有所误解,这或许源自远观而缺乏了解,才会觉得算法猛如虎。
但当你走近了算法分发,有了一定的了解之后,可能会有重新的认知:算法如虎,细嗅蔷薇。
一、不同平台下的自媒体生态
对于平台来说,创作者是什么?
如果把平台比作一个商场的话,不同的平台会有不同的选择,最典型的两种类型莫过于:自营 V.S 第三方运营。
一种情况下,整个商场全部是直营的店铺。
在这样的平台下,每个货架都是商场自营,所有的创作者对于商场而言,都只是供货商。
另一种情况下,商场只提供位置,所有交得起入场费的店铺都可以入驻。
在这样的平台下,每个货架都是创作者自己运营的。
直营商场的好处当然是体验可控、甚至于能够在某个特定垂类人群身上做到近乎可量化范围内的极致。
由于其收取的是商品流通中的利润,所以在短期内可以攫取巨大的红利,并用这些利润去给商场自身打广告,做新客获取。
但这样做的坏处也很显然,就在于供货商的角度缺乏灵动性,只作为供货商的创作者,由于缺乏足够的利润激励,很难生长出全新的品牌。
开放给第三方运营的商场,其好处当然是供货商的灵活性和多样性,商场赚取的是房租而非商品流通过程的利润。
一个常见的问题是,这种完全开放给第三方运营的商场是否会用户体验崩塌,比如会有各种在商场入口发小广告的,以各种图谋短线的方式来吸收商场的流量。
这就是局部失控与全局可控的关系。
在国内,全部直营的商场比比皆是;近乎完全开放给第三方运营的大商场,则恐怕只有微信了吧。
在所有平台都在告诉你什么是对的时候,只有微信很克制地告诉你什么是错的。
二、数据驱动自媒体迭代
站在自媒体的角度,又该如何面对平台?
如何应用数据驱动的方式,更加目标导向的面对不同平台呢?
首先,自媒体面临的问题是平台选择。
由于不同的平台有不同的分发规模和不同的发展阶段,所以,更应该选择适合自己品牌调性的平台,选择符合自己长线商业化变现角度的平台。
要区分清楚,哪些平台是叫好不叫座、哪些平台是叫座不叫好。
如果做电商导向的自媒体,那么基本上微博微信是必选项。
考虑到目前各个平台相对封闭,不提倡向微博微信导流,那么其在其他平台可能更多的在于曝光量和品牌建设的贡献,而不会对电商的销售转化有太大的贡献。
但对于承接品牌广告的自媒体而言,其利润更多的和内容的传播量有关,在传播量导向的角度来看,就应该更多的选择和自己品牌调性相符的、哪怕是一些垂直类的内容分发网站。
通过汇集全网各平台的流量,来实现自己对广告主的全网阅读量(播放量)的承诺。
因为每个平台的投入都需要牵涉到运营人力,所以如果一个平台的投入产出比不能够达到预期,就应该主动止损,避免进一步的资源投入。
在自媒体确定了自己选择的平台之后,就需要深究不同平台的分发特点,来进行针对性的运营从而提升自己在相应平台的曝光量。
常见的三种平台:编辑分发、订阅分发和算法分发平台。
对于编辑分发平台,最快速的方法一定是维系好和平台的关系。
因为在这样的平台上,其推荐位置都是人工分配的,更好的编辑关系能够保证自媒体有更好的流量曝光。
在编辑分发的平台上,时不时的会有相应的官方活动、积极地配合官方导向,就能从流量倾斜政策中获取红利。
对于订阅分发平台,做粉丝,做垂直品类粉丝是不二法门。
借由微信,其实大家能够看到一些常见的诱导分享的手段。
由于微信是一个规定行业下限,而非设定上限的开放式环境。所以在这样的平台上进行运营,首先需要保证自己有足够高的敏感度,对于一些新的传播形态可以及时跟进,从而最大化的获取时间差的红利。
比如,最近的微信小游戏,在前两周铺天盖地的通过微信群分享获得拉新机会;而最近几日,这条通路就完全被官方封禁了。
对于算法分发平台,尽管平台关系维护和粉丝数积累都需要,但是最需要投入的还是对于内容的包装。
因为你的内容不仅仅要抓住人的眼球,同时也要能够对机器算法的胃口。
通过研究过往一段时间的平台热门关键词,能够给内容的标题封面包装提供一些借鉴。
在我看来,运营的非常好的一个自媒体品牌非二更莫属,细细观察,其在不同的平台上都有不同的运营策略。
比如,在头条上的分发,二更就全面的在使用双标题、双封面的方式进行自己的内容包装。
一些视频内容能够在非常短的时间内就获得了上百万的曝光量。
不同平台上的不同运营方式,本质上还是一个数据驱动,目标导向的过程。
以下进行更细粒度的拆解:
他山之石可以攻玉,首先和大家介绍的是在国外,将数据分析指导内容生产做的非常极致的BuzzFeed。
BuzzFeed的员工总数逾千人,拥有全球新闻团队、自家视频制作工作室、尖端数据运算中心和内部创意广告机构,每月全网超过50亿次阅读,怎么看都是一个庞大的媒体集团。
然而,当我们深入了解BuzzFeed的工作流程后就会发现,与其说它是一家媒体公司,不如说它是一家科技公司。
“数据驱动内容创作”,这是BuzzFeed给自己贴上的标签。
在这家公司的内容创作和分发过程中,反馈闭环(FeedbackLoop)是出现频次最高的术语:
通过将市场环境和读者反馈数据尽可能的量化和结构化,及时反馈给运营人员、内容编辑,从而构成了辅助创作的一个闭环。
由于很早就树立了“将内容分发到用户常驻的平台,而非吸引用户到自己的平台看内容”的思路,YouTube、Facebook,Twitter、Vine等一众平台都成为了BuzzFeed的战场。
为了更好的理解用户反馈,BuzzFeed追踪收集并汇总了各个平台上的阅读传播和互动数据。
比起阅读量、分享量这些结果指标,其更关心内容分发和传播的过程。
以下图为例:如果只看终态数据,那么报表展示给你的无非是一篇内容从不同的平台渠道上获取了多少流量而已(下图左)。
但是深究下来,这些流量是如何来的呢?
是通过Facebook或Twitter上的分享,还是通过邮件的传播?
哪些节点带来了更大的辐射量和扩散量?
只有深入分析传播路径,才能给出这个问题的答案(下图右)。
不止于结果, BuzzFeed开始探究一篇内容的传播轨迹,他们开了一套名为Pound(Process for Optimizing andUnderstanding Network Diffusion)的系统。
通过给同一页面的不同分享追加不同参数的方式,来追溯内容在网络上的传播过程。
通过这套系统,人们意识到:传播并不是一棵简单的传播树,而是一片密集的传播森林。
每一次分享都构成了一棵新树,如果一个人的社交好友很多,那么这个节点的一度关系触达就会很广。
如果内容的质量一般没有引发进一步的传播,那么就会止步为一棵低矮的树;如果内容引发了大量的传播,就会变为一个繁茂的大树。
由于社交传播对于内容的影响力贡献巨大,BuzzFeed在衡量内容价值时,会更看重社交分享所带来的阅读量,并以名为“病毒传播提升系数(ViralLift)”的指标来衡量这一过程。
对于粉丝已经超过百万、内容阅读篇篇10W+的自媒体大号来说,这一衡量指标的制定不难理解。
如果一篇内容的阅读构成主要来自于自己的粉丝,那么就意味着粉丝们更有可能是基于惯性打开的,但是由于内容并没有触及到它们的兴奋点、没能引发认同,从而失去了进一步扩散传播的可能,也失去了触达更多潜在粉丝的机会。
对于BuzzFeed而言,在相近的总阅读量下,一篇“病毒传播提升系数”更高的内容,因为收获了更多的社交传播而变得更有价值。
有了技术追溯的支持,内容团队才能够总结出不同平台之上的内容偏好和病毒传播模式。
人们往往会夸大BuzzFeed的内容三把斧“清单体、短视频和小测验”,却忽视了在这些内容背后更深层次的数据支持。
具体到我们日常的内容阅读分析和粉丝分析过程当中,有哪些可以供分析注意的数据?
对内容分析来看,可以分为一次打开和打开后的体验。
一次打开是指不依赖于社交传播和搜索传播所带来的阅读量。
对于微博微信等粉丝分发平台,是指粉丝带来的阅读量。
对于头条、快报等推荐分发平台,是指经由推荐带来的应用内阅读量。
影响内容一次打开率最直接的因素有两个:
活跃粉丝量和内容包装
无论是粉丝分发平台还是推荐分发平台,活跃粉丝量都会影响内容展示的基本盘,只是传导系数不太一样罢了。
对于粉丝分发的平台,你有多少活跃粉丝就意味着有相应比例的基础展示量。
对于非粉丝分发的平台,你的活跃粉丝量会被视作你在平台上的贡献程度和受众情况从而影响分发权重。
同样的一篇内容,10万活跃粉丝的账号发布一定比1万活跃粉丝的账号发布会获得更大的基础展示量。
内容包装影响的是从展示量到阅读量的转化过程,更好的标题和封面图就像是精致的产品包装一样,有助于更好的促成转化。
比如在头条号平台上,就支持了一个非常酷的双标题双封面功能,能够给创作者对内容不同包装的机会。
对于标题,我习惯于引用咪蒙的观点:“不能在一秒钟看明白的标题,不适合传播,不是读者理解不了,而是他只能给咱们一秒钟。”
在咪蒙的工作方式中,她会把当天写好的内容发出来,交于自媒体小组的员工开始取标题。15-20分钟内,每人至少取5个标题。
这样,每一篇内容背后,都有近100个标题!
咪蒙随后会从中挑出5-6个标题,放到3个由用户顾问群里投票(每个顾问群都有人负责统计票数)。
咪蒙会参考最终的投票结果,决定用哪一个标题。
这种方式,其实就构建了一个最朴素的AB系统来验证标题对于内容一次打开率的影响。
为了便于比较,我们通常计算一次打开率而非打开量。
对于粉丝分发平台,一次打开率=阅读量/粉丝量
对于推荐分发平台,一次打开率=应用内阅读量/推荐量。
一次打开率对于不同分发模式的平台有不同的意义:
在粉丝分发的平台上,一次打开率能比阅读量更好地衡量自媒体账号的价值。
为了保证更高的一次打开率,需要更科学地获取精准粉丝、重视粉丝群体的互动维护,使得自身始终能够保持较高的粉丝触达率。
对于推荐分发平台,一次打开率考量了自媒体对平台分发特点的认知和对内容包装功力。
一次打开率(推荐点击率)高就意味着具有成为爆款的可能。甚至会收获比粉丝分发平台更大的阅读量。
三、阅读体验
如果说一次打开代表了上门推销人员成功敲开了用户的房门,那么阅读体验衡量的就是用户是否会为这次推销最终选择买单。
用户是带着对作者品牌和对标题封面的认知预期打开内容的,只有实际消费体验与预判一致、甚至超出预判,才算得上是好的阅读体验。
我们之所以抵触标题党,并非因为它骇人听闻,而是因为用户抱着骇人听闻的预期,点击进入详情页之后才发现内容平淡无奇。
想要衡量消费体验,内容的消费比例是一个重要的指标。
对于图文来说这个指标是平均阅读进度和阅读速度。
对于视频来说是播放进度和播放时长(因为用户会有快进的行为,所以100%的播放进度并不意味着100%的播放时长)。
平均消费比例越高,代表用户的认可度越高、消费体验越好。
除了内容消费比例指标以外,内容是否引发了读者互动也是一个常见的考察角度。
如评论、点赞、收藏、转发等,这些指标的横向对比通常用于组织内部考核不同编辑的创作能力。
其中,个人建议需要额外关注的是评论和转发两个指标。
评论扩展了内容的深度,更多的用户评论给正文提供了不同的视角分析和信息补充,可以有效的引发围观用户的阅读兴趣,提升用户在内容页的整体停留时长。
促进评论的提升算是有一些技巧性的部分:
选题有冲突性或者有代入感,在正文中留有悬念,主动引起讨论、投票,在评论区中带节奏等等都是行之有效的方式。
转发扩展了内容的广度,更多的转发能够带来更多面向潜在受众的曝光,这一点对于以粉丝分发为主要模式的系统尤甚。
对于转发指标,我们可以套用BuzzFeed的病毒传播系数的计算方式:
Viral Lift = 1 + 传播阅读量 / 一次阅读量
四、粉丝增长分析
对于自媒体而言,虚高的粉丝数除了忽悠投资人和广告主以外,对自身成长是毫无意义的。
想要可持续发展,只有精准的粉丝才有价值。
那什么是精准的粉丝?
我想,应该是指能够给自媒体带来变现价值的粉丝。
粉丝增长分析,就是围绕有变现价值粉丝算的一笔账:如果一个粉丝能给自媒体带来5块的净利润,那么花低于5元的成本来购买这个粉丝就是划算的。
首先,引入三个概念——LTV、CAC和ROI。
LTV(Life Time Value):生命周期总价值。
一个粉丝从关注你的那一天开始到取关或者脱离平台为止,能够带来的收益。
通常按渠道来计算,如果某个渠道或某个平台的用户不精准、付费意愿差,那么这个渠道的用户LTV就相对较低。
CAC(Customer Acquisition Cost):用户获取成本。
同样跟渠道有关,自媒体需要持续的发现低价、优质的渠道,抢占红利期。
比如2015年初,微信广点通渠道的公众号涨粉,单个用户获取成本只有1-2块钱。
ROI(Return On Investment):投资回报率。
计算公式为(收入-成本)/成本。
应用于粉丝增长场景就是(LTV-CAC)/CAC。
衡量的是:你从一个粉丝身上挣到的钱,是否能够覆盖获取这个粉丝的成本。
通常应该做ROI>1的事情,这样才能够保证业务的可持续发展。后续也都围绕这个角度展开。
首先,现身说法,举一个亲身犯下的“人傻钱多”的蠢事。
15年初,微信朋友圈集赞的路数还很火热,我们也不能免俗,搞了三场集赞有礼的活动。
三场集赞有礼的活动,表面上看起来一面光鲜,各种指标在活动日都有显著的提升。但是兴奋过去之后的分析,却让人笑不出来了。
三次活动中,发起活动的老用户重叠度越来越高,带来的新用户越来越少,同时,新用户的次日留存情况也越来越差。
于是,我们开始反思用户为什么要参加集赞有礼的互动?唯利尔。
老用户发起活动,他所带来的新用户无非是看一眼品牌广告,帮朋友支持一下。
如果实物奖品价值还不错,那么这个新用户也会发起,但目的在于奖品而非公众号。
此外,设计过高的门槛使得有的用户不乐意参与,有的用户则自建了群开始互相点赞,达不到拉新的作用。
想要提升用户增长的ROI,就必须降低新用户中非精准用户的比例,从而拉升渠道用户的LTV,降低用户获取成本CAC。
由此入手,我们优化了转发集赞拉新的方式,新一期集赞活动的礼品是凯叔西游记第二部的部分章节收听权,每个用户只需要拉5个用户就能获得。
因为是虚拟产品,CAC得到了显著降低。
而儿童故事音频跟微信账号捆绑只能自用,用户如果不是真有需求就绝不会参与活动,从而提升了新增用户的精准程度。
在后续的此类活动中,我们都有意识的对礼品的形态进行了控制:
实物礼品用于鼓励已有的活跃老粉丝,虚拟礼品用于激活和拉新。
运营微博、微信这样的平台,我们很容易沉迷于追求短期粉丝数字的飙涨而举办各种活动。
某些活动拉新从CAC的角度看或许是划算的,但深究其所带来的真实活跃粉丝,就往往会发现ROI远远小于1,充其量只能算是一次展示广告曝光,做了一笔又一笔的蚀本生意。
想要算清楚用户的ROI,有赖于用户身份的识别和渠道的追溯。
在这一点上,微博和微信的基础建设比较完善。
以微信为例,基于平台提供的二维码,我们可以追溯不同用户的来源并标识,就像是安卓应用下载对于不同的应用市场打不同的渠道包一样。
进而,通过平台提供的外链功能、私信功能,来识别用户的活跃情况。
对于付费增粉渠道,每隔一段时间暂停一些,比较渠道暂停前后自己粉丝量的增长情况和粉丝阅读占比、线上活动粉丝参与量情况,建立起对付费渠道更清醒的了解。
通过数据分析的方式,能够让我们更加清醒的审视内容创作的消费性好坏,粉丝积累的性价比高低,从而以更经济的方式提升自己的增长速度。
原价:58
笔记书堂读者专享:46.4(省11.6元)
笔记侠好文推荐:
吴声新物种演讲两万字完整笔记:对未来的真正慷慨,是把一切都献给现在
看完了,给笔记侠点个赞再走呀↓↓↓