豆瓣、猫眼和 IMDb 的电影评分是怎么得出来的?
若批评无自由
则赞美无意义
最近关于一些电影的话题大家总是争论不休,先是有冯小刚撕王思聪,后有豆瓣、猫眼被指恶意刷电影评分。。。
差评君自己其实算是个爱看电影的人,但实在摸不清,为什么单纯看个电影也可以搞出那么多事,一千个人眼中有一千个哈姆雷特,就不能把自己真实的感受告诉大家么?
嗯,今天看到一篇针对这事儿的文章,对里面的一些规则阐述的还是比较清楚的,大家可以看一看。
本文转自微信号:爱范儿,ID:ifanr,作者:刘莎。
12 月 28 日,《人民日报》客户端转载了《中国电影报》的一篇文章,并以《豆瓣、猫眼电影评分面临信用危机 恶评伤害电影产业》为题发布。由此,拉开了事件的序幕。
随后,某媒体报道称“豆瓣、猫眼已因评分过低被电影局约谈”,将事件推向了高潮。
一时间,网络上有关此事件的讨论者众。但电影局局长张宏森晚间在朋友圈回应,该报道系过度“猜想了事实,电影局实际上没有与豆瓣有过任何接触。豆瓣 CEO 阿北也被“炸”了出来,澄清并未被“约见”,只是媒体弄错后的误传。
《人民日报》评论部也在晚上发表题为《中国电影,要有容的下“一星”的肚量》的文章作为回应。
一时间,口水与手指齐飞。当大家争论的焦点集中在“电影到底烂不烂”、“批评到底对不对”时,针对电影评分制度的讨论也一同展开。
观众更多地从自己的体验出发,普遍认为自己有对所观看电影进行评价的自由。代表体制的电影局则从行业的宏观发展角度着手,认为创作和批评是电影的一体两面,试图拒绝批评无益于电影的进步。
电影的直接利益关系者——片方,也认同中国电影需要评价体系。他们指出,中国电影不是批评多了,而是良性批评太少、有建设性的批评太少。
看上去,表面上矛盾重重的各利益方也并非“没有共识”。作为面向大众发行的艺术创作,电影要接受来自多方的评价是一件“顺其自然”的事情。因而对电影的评价,从来就不是“对不对”的问题,而是这个评价标准到底“好不好”。
一般来说,对一部电影的评价主要有两个参考体系:电影本身的质量和观众的个人喜好。除了专业的电影研究者,观众受第二种因素的影响更深。其中,个人情怀、文化差异甚至粉丝效应等因素又会使得每个人的评价变得更为主观、有倾向性。再加上近些年不断涌现的“水军”现象,电影评分的权威性越来越受到人们的质疑。
在中国的电影爱好者心中,豆瓣是绝对不会错过的一个驿站。文艺青年可以在此闲话法国新浪潮和意大利新现实主义,迷妹们可以为自己“墙头们”参演的大片点赞……更多的人,可能根本对电影没有太多研究,但也会选择在买票或观影之前参考一下豆瓣电影的评分。
可以说,豆瓣电影的评分一度成为大家评价电影质量的标杆。那么豆瓣电影的评分标准到底是怎样的呢?
豆瓣 CEO 阿北曾在 2015 年发表长文,解密了豆瓣电影的评分机制。他指出,豆瓣电影的评分基于用户打分。简单来说就是这么一个程序:把豆瓣用户的打分(一到五星换算为零到十分)加起来,再除以用户数。这个分数完全来自程序的计算,中间没有编辑审核,每过几分钟,程序会自动重跑一遍,以便把最新的分数加进来。
由此来看,猫眼把两个评价体系都展示出来,交由用户自己去判断影片的价值,兼具了专业性和大众性。但也有人指出,这种看似“贴心”的方式其实存在诸多弊病。
首先在观众评分方面,基于购票场景,猫眼的受众更广,且准入门槛较低,评分者中可能混杂了影迷、意见领袖甚至水军;其次在专业评分方面,专家数量和专家的专业程度都受到不同程度的质疑,前文提到的《中国电影报》的文章中就指出,“猫眼专业影评人凭什么一句顶一万句?”
猫眼对此有过应对。他们对普通评分者进行了区分:购票观看的评分者会在用户名后添加一个“购”字加以区别,这在一定程度上能够减少水军刷分的影响。
但针对专家评分的质疑,想要改善就难得多了。毕竟再资深的电影专家,终究逃不开个人价值取向对评分的影响。在此次风波之后,猫眼暂时关闭了专业评分功能,并称优化方案还在探讨中。
尽管存在种种缺陷,但以猫眼为代表的在线购票平台评分体系在大众化方面还是比豆瓣要强一些。
IMDb:走自己的权威之路,让其他人说去吧
传说中的 IMDb(互联网电影数据库),则完全是另一种玩法。创立于 1990 年,IMDb 是国际知名的权威电影点评网站。除了“看上去好厉害”,IMDb 的电影评分机制也相对更加专业和神秘。
根据 IMDb 网站的介绍,他们的评分采取“加权平均”的计算方法。尽管并未透露算法细节,但 IMDb 表示,在他们大名鼎鼎的 TOP 250 榜单中,采用的是贝叶斯统计算法,公式如下:
其中,WR 指最终的加权得分,V 指投票人数,M 指进入 TOP 250 所需的最小票数,R 指普通算法的平均分,C 指目前所有电影的平均分。
值得注意的是,V 代表的投票人数,仅包含“经常投票者”。这是 IMDb 为了保证 TOP 250 榜单的权威性,尽量把投票者限制在资深影迷范围的举措。
举个简单的例子,知友@陈博学这么解释 IMDb TOP 250 的算法逻辑:
电影 A,十个人看过,全部评分均为 10 分;电影 B,十万个人看过,评分平均值为 9.8 分。
请问你愿意相信哪部电影更加优秀?贝叶斯算法的核心思想就是避免让电影 A 的最终得分超过 B。
但百密之中必有一疏,如此严格的评分机制也曾被“刷分”冲破。当年《蝙蝠侠:黑暗骑士》上映时,曾被粉丝用“刷分”的方式抬上首位。同时 IMDb 对“经常投票者”的定义方式也颇受争议。但总的来说,通过这种复杂的计算方法,IMDb 能够在一定程度上挤掉“非正常评分”的水分。
评分是面子,质量是里子
如此看来,各大平台的评分制度都有优有劣。而无论批评还是赞美、权威还是业余,电影评分始终难以绕开主观因素的影响。喜欢小清新的观众可能会给《行尸走肉》打低分,而热爱商业大片的影迷可能也无法理解《路边野餐》中的长镜头。但你能因为这些“差评”就认定这些是“烂片”吗?
归根结底,评分就只是一个参考系,一部电影的价值并不会因较低的评分而被抹灭,单纯靠打高分也无法帮助电影实现真正的成长。
不过在电影越来越商业化的今天,空谈电影的艺术价值还是过于理想化了。就如同公司的各项 KPI 指标,电影的评分、票房收入往往直接与其价值划上等号,甚至可以决定一部电影、一个电影人的命运。
而对观众来讲,当我们开始习惯于用“几颗星”来标记对一部电影的观感、用评分来决定是否去看一部电影时,电影评分对我们的价值不会比绩效考核表上的参考系数更多。
有豆瓣网友在《罗曼蒂克消亡史》的页面留下这样的评价:“电影我没看懂,导演没打算让大家看懂,这是艺术片,是拍给下一个世纪的人看的。”你说这样的评价到底是批评还是赞美?
看了电影的人可能不知道,但我知道的是,没看的人肯定不知道。
-。-