查看原文
其他

新榜指数NRI算法说明

2016-04-17 智善法律新媒体 智善



一、什么是新榜指数?

新榜指数(New Rank Index,NRI)系由新榜(newrank.cn)基于海量数据、用户深度反馈及专家建议而推出,用于衡量中国移动互联网渠道新媒体(主要指两微一端)的传播能力,此指数反映该新媒体主体的热度和发展趋势。

以下算法主要针对微信进行阐述。


二、算法简述

新榜指数是由原始数据参照基数通过计算公式推导出来的标量数值, 用以衡量原始数据在其所属维度的相对表现。例如,xx 点赞数为:379,我们会将这一数据和点赞常数进行比较,以确定其点赞数的相对位置,进而转换为其点赞指数,其余指标以此类推。


该算法相较于常规加权有四大优势:1、不仅显示绝对表现,还能反映所处位置;2、标准化后,不同维度的指标之间可以相互比较;3、指标之间可以相互运算,从而得到综合考察各维度的新榜指数;4、 不仅可以用于用户间的比较,也可以用于用户自身的跨期比较。


三、算法详解


1、选定指标

在微信的计算中,为兼顾其数量与质量,我们使用总阅读数、最高阅读数、平均阅读数、头条阅读数、总点赞数五个指标来对账号进行评估,其中:



2、指标标准化

基于不同维度指标的差异性,我们首先将所得数据标准化,即通过对各维度原始数据与该维度常数的比值计算,得到该样本各项指标的千分化数值。

在新榜指数中,以天为最小计算周期,将常规(1天推送一次,每次最多8篇)的公众号为对象在这一时间段内总阅读数、最高阅读数、平均阅读数、头条阅读数和点赞数共五个指标的常数分别记为:




结合新榜历史数据样本库及微信平台的发布规则——1个常规的微信公众号每天最多发布8篇,每次单篇阅读数最高为 10 万,故而我们记录 80 万为“总阅读数”这一指标理论上的1000分,对于某些特别账号——例如每天可以推送多次的人民日报、央视新闻,则理论上,在该指标上可以获得比 1000 分更高的得分。故而



注:此处“+1”是为了避免出现类似“0阅读”时而产生无效值。


3、指标加权

由于此五项数据影响微信传播能力的程度不同,我们赋予不同的权重,分别记为:



最终,新榜指数的计算公式表述为:




目前,我们使用的系数为:




新榜始终相信,不同类别之间的简单比较是没有意义的,所以,在发布需要跨类别比较的月榜暨“中国微信 500 强”时,我们会赋予类别系数,彰显渠道价值。具体系数表如下:



四、算法所使用数据的统计口径

日榜的统计周期是所示日期0时至24时间,统计截止时间是次日中午12时,以确保子夜发布者亦可得到至少12小时的传播。周榜的统计周期是所示日期范围(周一0时至周日24时),统计截止时间是下一个周一的中午12时。周榜并非日榜数据的简单加总,而是重新更新并统计。月榜、年榜亦然。

需要特别说明的是:根据腾讯官方政策,微信影响力榜单所列微信阅读数仅指前台显示数据,且超过10万者一律显示为10万+,与微信管理后台所显示数据可能不一致。


五、FAQ


1、为何要设定常数?

正如我们将“1米”定义为平面电磁波(光)在“1/299,792,458 秒”的持续时间内在真空中传播行经的长度一样。我们基于理论值和实际观测值设定了各个指标的相对参考值,用来对各个指标进行归一化处理;


2、1000分是最高分吗?

不是。但是1000分可以视为一个常规号(一天发布1次)的能够达到的极限——发满8篇,每篇阅读数10万,点赞1万。对于少数公众号,例如人民日报、央视新闻则存在理论上超越这一得分的可能;


3、常数设定中的点赞数的最高值为何没用10万,而是1万?

在实际的观测中(超过1000个样本),新榜的技术人员观测到过6万+的单篇点赞数,但是这是属于及其特别的个例,通过测试样本分布(单篇点赞超过1万的样本比例远小于万分之一),我们选定1万作为理论上限;


4、算法会经常变么,如发布上限从8篇/天变成了10篇/天?

新榜指数的核心价值是为所有公众号提供了一个参照系,只要这一个参照系是稳定的,那么比较就是有意义的。一个稳定的体系更有利于长期的观察和度量;


类似微信策略的变化只会使得总阅读一项指标变得更容易得到1000分,甚至超越这一分数,但是并不对这一算法有着决定性的影响。


新榜技术人员会对数据环境进行长期跟进,如果确有极大的影响,会及时优化调整算法版本,并通过公开渠道统一说明;


5、新榜指数可以跨期比较么?

可以。新榜指数为单调增函数,只要时间维度一致(日、周、月、年等),公众号之间、自身与自身都是可以比较的。



六、拓展:两微一端的独立及跨平台应用


1、微博、腾讯微社区、新闻客户端等独立应用

通过标准化指标使得转发、评论、PV、UV、楼中楼回复等变成独立可比较的指标,每一个指标均反映该对象在全部样本中的独立表现,进行加权得到独立应用场景下的新榜指数;


2、双微及两微一端的综合应用

与独立应用类似,跨平台的新榜指数分别考察某一对象在单一平台上的相对表现,最后在使用平台系数进行加权从而得到综合后的新榜指数(如微博+微信)。



来源整理| 柳丁文

责编| 高丽君


您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存