查看原文
其他

从IMDb的角度看,豆瓣评分真的有那么不堪吗?

2017-01-04 效率火箭 效率火箭



尽管豆瓣的评分体系在准确度上依然略逊于IMDb,但评分体系本身并没有好坏的明显界限。只要建立合适的放作弊机制,任何体系都是值得信赖的。


下面火箭君就给你解释为什么这样认为:

了解下IMDb

IMDb是什么? 

IMDb全称为互联网电影资料库(Internet Movie Database),是目前全世界最知名的电影评分网站之一,同时它的评分均来自于观众而非专业电影从业者。它目前的Alexa世界网站排名为55,而豆瓣为346。可见其体量和知名程度。


豆瓣与IMDb评分系统的差别

01

评分算法的差别

>>>IMDb的算法:

根据IMDb网站中有关评分计算的自述,其IMDb 250榜单的排名采用了贝叶斯估计法,并遵照了以下的计算公式:

weighted rank (WR) = (v ÷ (v+m)) × R + (m ÷ (v+m)) × C

其中:

  •     R-该部电影的加权平均分

  •     v-投票人数

  •     m-进入IMDb 250榜单所需要的最小票数,目前为1250票

  •     C-目前所有电影的平均得分


>>>豆瓣的算法:

尽管豆瓣官方并没有出台过有关评分计算的具体方法,但通过豆瓣创始人阿北之前博文中的描述:

豆瓣的注册用户看完一部电影,心情好的话会来打个一到五星的分(有时候心情不好也会来)。比方说一部电影有42万用户打分。我们的程序把这42万个一到五星换算成零到十分,加起来除以42万,就得到了豆瓣评分。这个评分会自动出现在豆瓣各处,中间没有审核,平时也没有编辑盯着看。每过若干分钟,程序会自动重跑一遍,把最新打分的人的意见包括进来。

可以基本理解为,豆瓣的算法基本就是最简单的加权平均。同时,简单将5星评分系统转换成10分制的评分结果,也必定造成一定的误差。


02

投票统计的差别

>>>IMDb的统计:


IMDb对于每一部电影的评分,均进行了较为详实的投票人群分析,从性别、年龄等多个维度展现了投票人群画像。


>>>豆瓣的统计:


而豆瓣在评分统计时,仅能体现全体用户所打的星数,以及对应的占比。但火箭君个人认为,豆瓣通过用户行为的分析,基本能给投票人群进行较为准确地区分,只不过这种间接的分析结果,可能会造成用户对于评分可信度的质疑。与其多一事,还不如少一事,因此豆瓣就没有将投票打分人群再进行更细的划分。


03

防作弊机制的差别

>>>IMDb的防作弊:

虽然IMDb没有公布具体防作弊机制的原理,但就IMDb 250榜单的投票人群选择上,其明确表示,只接受Regular Voter的投票结果:


尽管没有明确定义,但至少可以认为这样的举措将有利于降低刷票的行为。

>>>豆瓣的防作弊:

这点上豆瓣一如既往地固执其自身的判断法则,也没有对外公布防作弊机制。我们仅能从阿北的博文中窥探一些他的“执念”: 

豆瓣这两年的原则是“所有能判断属于非正常评分的一概不算”,不分高低贵贱颜色。(捍卫评分公正的用户,真的抱歉加感激。但这应该是我们的工作,不是大家的,一时没做好是我们失职。)。“不算”非常简单可操作,但“判断属于非正常评分”不是那么直接。豆瓣一代接一代的算法工程师、程序员、编辑和产品经理在这件事上贡献过才智,最后都落实在二十四小时跑的大小程序上面。这确实是持续的、魔高一尺道高一丈的事情。但现在门槛已经很高,声称能刷分的基本是在骗人。

但不公布,不代表不做。从阿北的博文中可以看出,豆瓣对于打击刷分行为的严肃程度,在这几年并没有放松,相反,还有所上升。只不过,任何时候,你考虑问题都很难做到尽善尽美,但只要不断改进,那防作弊系统的成果还是可以值得用户信赖的。


要分清的是,IMDb所公布的计分方法,仅适用于Top 250榜单。对于榜单外的计分方法,这也是一个迷。




您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存