查看原文
其他

游戏评分江湖:和烂番茄、豆瓣的同与不同| 东西「市场特写」

东西文娱 2023-10-23

Editor's Note

市场特写,关注一个市场的多面

The following article is from 东西游戏 Author 东西游戏

近日,射击冒险游戏《生化危机4 重制版》在发售前公开了海外媒体评分。IGN、GameSpot等知名媒体纷纷打出满分,评分汇总网站Metacritic上的分数高达93分,成为今年目前分数最高的新作游戏。


这一高分引发了玩家社群的热烈讨论,更助推了《生化危机4 重制版》的预售,使其在发售前一周就成为了Steam上销量最高的游戏。


有趣的是,IGN在评价《生化危机4 重制版》的文章中,还附上了过往对该系列其他作品的评论,总数竟多达60篇——作为全球最知名的游戏媒体,IGN恰巧和“生化危机”系列一样诞生于1996年。


过去27年来,IGN为几乎每一部、每一版“生化危机”作品都打了分、撰写了评论,这次回顾相当于昭示了游戏评分与产业共同发展的历史。


自电子游戏1970年代诞生以来,随着游戏市场遍及全球,游戏评分被媒体带到了世界各地,为玩家与从业者们提供了丰富的话题。在游戏评分的历史背后,是媒体、厂商、销售渠道之间若即若离的合作与角力,也是游戏产业长期高速发展的写照。


当然,媒体发表的评分并非总是受到认可。早些时候,《卧龙:苍天陨落》在Metacritic获得了81分,却被不少玩家认为“过誉”——媒体在评测时主要采用高性能的PS5和顶配PC,没有重视游戏的优化问题,游戏实际发售后程序漏洞和优化缺陷才被曝光,结果在Steam上得到了“褒贬不一”的用户评价。


如今坊间流传着“低分信媒体,高分看自己”的说法。不过,游戏媒体的评分依然对玩家社群和产业有着不可忽视的影响力。而且和电影评论一样,游戏评论通过几十年的发展,逐渐塑造出了稳定的商业模式。


此外,随着玩家社群发展,玩家评分的影响力也日渐提升。在尤其在独立游戏、免费游戏与服务型游戏上,创造出了专业游戏媒体所不能及的声量。游戏评分也由此成为全球玩家表达观点的手段,从单向的导购指南变成了多向的交流平台。



     


从街头杂志走进企业财报:游戏媒体评分体系的建立


游戏评分的历史几乎和游戏产业本身一样久,最早是作为游戏杂志的副产物而诞生。历经约四十年的发展,游戏评分如今已成为全球游戏玩家和厂商衡量产品的关键指标之一。


1970年代,游戏产业开始萌芽,当时势头正盛的纸媒立刻跟上了这股潮流。当时在美国出现了报道各种线下娱乐的杂志,会向读者提供街机游戏的情报。


1980年代初,美国游戏产业遭遇了“雅达利震荡”,又逢任天堂推出经典产品红白机,游戏产业的发展重心一度转移到日本市场,催生了日本最有名的游戏杂志《Famitsu》(全称“红白机通信”)。


诞生于1986年6月的周刊《Famitsu》是迄今世界上最长寿的游戏杂志,而它在当年10月开设的“交叉评测”栏目,对后来全球的游戏媒体都产生了影响,堪称游戏评测的鼻祖。


“交叉评测”的具体方式是,由《Famitsu》的四名编辑对同一款游戏进行十分制打分,也就是满分为40分。总分达到35分的游戏,则会被称为进入“白金殿堂”。这种评分方式沿用至今,而《Famitsu》的评分也一直是世界上最具影响力的游戏媒体评分之一。



到1990年代,全球的游戏产业迎来发展黄金期,美国、西欧、中国、俄罗斯等地都诞生了不少游戏杂志,像《Famitsu》这样的游戏媒体评分也成为了媒体的惯例。各家纸媒的编辑部形成了不同的游戏评分方式,有的是组织多人评分,有的只让一名编辑单独评分,还有媒体只写评语而不打分。


无论采取什么形式,这些评分的目的都是向玩家提供直观的导购建议。在互联网尚不发达的时期,纸媒几乎是各地玩家获取游戏情报的唯一途径,而纸媒对游戏的打分也成为了玩家判断是否购买某款游戏的重要依据。


进入21世纪后,以IGN为首的网媒迅速崛起。网媒能更及时地传播信息,因而其提供的评分也更加受到玩家的关注。而且在这个网络时代,媒体越来越多地与游戏厂商进行合作,争取在游戏发售之前就给出评分;否则等到游戏发售,媒体提供的评测很可能会立刻淹没在信息海洋中。


如今网络媒体虽然普及开来,但并非所有媒体都能提前获得游戏拷贝。总的来说,游戏大厂依然只会向他们信任的游戏媒体优先提供评测权限。这保证了媒体提供的发售前评测仍具备独家性,且会被玩家所期待。


实力雄厚的游戏硬件厂商自然没有忽视媒体对市场风向的影响力。索尼、微软、任天堂都各自有赞助或直接运营的游戏纸媒与网媒。不过这些有硬件官方背景的游戏媒体,往往会回避直接打分,更倾向于介绍游戏产品特色和幕后花絮。


伴随网媒一同出现的,还有以Metacritic为首的评分汇总网站。Metacritic就像是游戏界的“烂番茄”网站,会收录专业媒体与评论人的游戏评论,生成一个平均分,代表着“权威人士”对一款游戏的整体看法。


正如“烂番茄”在电影界颇具影响力一样,Metacritic这类网站也进一步提升了游戏媒体评论的地位和曝光度。这种评分既代表着游戏作为艺术作品的品质水准,也很可能影响游戏在上市初期的商业成绩。


事实证明,汇总评分确实迎合了大众与产业的需求。Metacritic上显示的媒体评分不仅为玩家所重视,还有曾被一些游戏公司写进财报,甚至作为评定项目成败的标准。


至于Metacritic的业界影响力到底有多大,美国贝塞斯达公司2012年给出了一个知名案例。在那一年,贝塞斯达发行、黑曜石娱乐开发的《辐射:新维加斯》发售,而据黑曜石的员工后来透露:贝塞斯达向黑曜石许诺,如果游戏能在Metacritic上取得85分,就会给他们发放额外奖金。


结果纵使《辐射:新维加斯》发售后在Metacritic上收获了零差评,平均分却是84。仅因这一分之差,黑曜石与奖金失之交臂,间接导致了这家工作室随后的财政危机与人员裁减。






游戏评分面临的三大争议:标准缺失、商业规制、覆盖范围有限


游戏评分由于传播广、影响大,长久以来都是受游戏社群与产业关注的热点。尽管现今的媒体评分模式仍相对稳固,但有关媒体评分的争议从未停息。近年来也有媒体在尝试改变评测方式,比如IGN在2020年宣布,评分的小数点后一位并不具备足够精确的含义,因此改成只打整数分。


无论对于游戏、电影还是其他创作,用户和业界之所以需要评分网站,很大程度上就是因为人们对作品的评价标准与理念很难完全达成共识。


影评、乐评等领域也几乎没有公认的评价标准,不少人认为评价方式不应该被定型或统一。但这些艺术体裁毕竟历史更久,知名奖项、媒体与学术机构还是为评论者提供了可参照的坐标系。而游戏的评分标准则要模糊得多,产业内外尚未形成相对普遍的理论体系。


游戏作为媒介综合体的性质,更是放大了评价的主观性。游戏可能被评价的方面包括图形、叙事、音乐、美术、操作、游戏性等内容,这其中任何一点都足以单挑出来评论。媒体评论所覆盖的内容,更多地取决于撰写者侧重哪些方面。


在这种局面下,游戏媒体评分就可能差异极大。Metacritic显然也注意到了这点——它不像“烂番茄”一样直接显示好评率,而是采用了一套保密的加权算法,对不同媒体的分数施加不同的权重,还会把只有评语的媒体评价转换成可量化的分数。


而在《辐射:新维加斯》事件发生后,一些媒体指出业界应当理解评分标准的模糊性:84分和85分并不存在显著的差异。特别是Eurogamer和Kotaku这两家相对严苛的知名媒体,意识到给出较低的分数就可能给产业带来负面影响,因此主动退出了Metacritic的媒体收录名单。后来Eurogamer又进一步放弃了打分,只发表评语。


即便是同一家媒体,其评分标准也可能不断变动。例如早期的《Famitsu》编辑们就相信没有任何游戏是完美无瑕的,因此创刊12年后才出现第一款获得满分的游戏——《塞尔达传说:时之笛》。



但后来的编辑们显然不这么认为:从2000年到2023年这24年间,满分游戏多达25款,其中不乏《最终幻想XIII-2》《JOJO的奇妙冒险:全明星大乱斗》等饱受争议的作品。这导致玩家开始猜测,《Famitsu》的高分背后是否收受了游戏厂商的好处。


在美国,有匿名的发行从业者透露了游戏厂商与评分系统间的利益关系是如何展开的:“60美元的免费游戏、豪华酒店的派对、晚餐与气氛组……在给出这些好处后,厂商换来的高分评价更是无价之宝。”


无论是否涉及直接利益,目前评分系统与厂商的配合都已成为了共识,首先就体现在评分发表规则的统一上。如今海外大厂基本都会规定新游戏的媒体评分及Metacritic分数的解禁时间,甚至会限制评测所能提及的内容,以试图控制评分对玩家购买决策造成的影响。


反过来,玩家社群也在利用这种规定来推测游戏品质。例如《生化危机4 重制版》的评分解禁日定在发售一周前,就有知名论坛的投票结果显示,超一半的玩家预测游戏能在Metacritic获得90分以上的成绩。而去年的同类型游戏《木卫四协议》将评分解禁日定在发售当日,许多玩家便对游戏持悲观态度,最终游戏果然在Metacritic只取得69分。


然而,不管是评价标准的模糊还是利益关系导致的过誉,在现阶段都还不至于影响媒体评分的地位。游戏媒体评分真正的挑战,在于对游戏形态演变的持续关注。


在当下,同一款游戏在不同设备、不同时间的体验可能大相径庭。《卧龙:苍天陨落》就是一例,即便是内容相对固定的单机游戏,亦可通过更新补丁来改变游戏表现。


此前还发生过和《卧龙:苍天陨落》相反的例子:IGN在评测2017年的《掠食》时,因为遇上程序漏洞而只给了游戏4分;结果后来开发商修复了此漏洞,IGN只好在玩家的抗议下罕见地将分数大幅提至8分,其权威性也再度受到质疑。



单机游戏尚且如此,对大量做长期运营的网游、手游来说,在特定时期得到的评分更不足以代表游戏的最新表现。特别是网游、手游在上市初期往往只提供部分内容,或者在线人数还不足以支撑游玩体验,那么媒体就无从给出时效性可靠的评分。


如今在服务型游戏领域,媒体评分的重要程度就已衰减到了近乎缺席的地步。取而代之的,则是玩家群体自发的持续评论与口碑传播。




购物反馈、自媒体与“恶评轰炸”:玩家评分的崛起


互联网发展的一大特征,就是凸显了普通用户引发的舆论。IMDb和豆瓣这类用户评分网站在影评界产生了深远的影响,而游戏评论界同样正在被普通玩家的观点重塑——Metacritic和烂番茄这类主打媒体评分汇总的网站,早就开放了面向普通用户的评分功能,与媒体评分形成了对照。


除了传统的评分网站,以Steam、亚马逊和各移动应用商店为主的游戏销售平台,同样允许用户自行评价游戏。这些销售平台直接面向消费者,收集的也是最直接的产品感想反馈。


如今在游戏领域,用户评论的覆盖范围已经远超数量有限的媒体,而且评论类型更加丰富,成为了不少玩家新的参考指标。


以主打PC游戏销售的Steam为例,其评价体系是由简单的“推荐/不推荐”选项和评语栏构成,却是目前直接最能直观反映PC游戏流行程度的指标。甚至有产业分析师给出了基于Steam上的用户评测数量推算游戏销量的公式。


在Steam的游戏评测区里,全球玩家留下的评价五花八门:有人成立了自媒体,给出具体的分数和详细的评价标准;有人怀念游戏带给自己的回忆;也有人只是在痛骂厂商。这类反馈已是PC游戏玩家的刚性需求,以至于Epic游戏商店一直因为缺少评论功能被用户批评。


Steam的用户评分图表(Dota2)


此外还有其他聚集了大量玩家的网络社群,例如论坛、社交媒体与视频网站,都可能成为用户评价游戏的阵地。游戏媒体Gamasutra曾表示,在采访过一些开发商和发行商后,他们发现视频主播对独立游戏的宣传作用超过专业游戏媒体。


知名网络杂志《Slate》也评价过这一现象:“游戏公司现在会直接接触游戏爱好者,作为建立品牌的更好方式。既是因为游戏玩家变得比游戏记者更有影响力,又是因为这些爱好者与目标受众的关系远比记者要密切。像任天堂就已经这样做了很多年了。”


除了渠道、平台带来的便利,用户评价变得丰富积极的另一大原因,则源于F2P(免费游玩)游戏的流行。根据Newzoo的统计,2022年下载免费、道具收费的网游、手游已在游戏产业中占有一半以上的收入。


起初媒体评分受到重视的原因之一,是用户必须付出远高于一张电影票的价钱,才能买到一款或许无法退货的游戏,因此用户认为有必要先参考媒体评论。


而如今免费游戏大行其道,用户不用再顾虑购买门槛。所有人都可以先下载尝试再决定要不要为内购项目付费,或者基于自己的体验发表评论、参与社群讨论——在这整个流程中,可以完全不需要媒体评分的参与,用户自身几乎完全掌握了话语权。


TapTap玩家评分


不过用户评论在覆盖范围广、反馈速度快的同时,其缺陷也显而易见——整体情绪性较强,信息量密度也较低。用户可以只玩两分钟游戏就打出一个差评,甚至是为了游戏以外的事情来发泄情绪,也无须对其言论与评价负责。


各游戏平台都经常出现“恶评轰炸”这类用户基于激动情绪而实施的集体行为,难免会干扰平台机制、社群氛围与评分可信度。Steam就在2019年开启了对“恶评轰炸”的排查机制,但这类行为终究不可能完全控制或回避。


现阶段来看,媒体和用户评分机制尽管不乏价值,但仍不够完善与体系化。若是横向对比电影、文学、音乐等领域的评论鉴赏,游戏评分在文化性、学术性与产业价值上的建构,都还有长路要走。


不过如果从“导购”这一评分最基础的功能出发,Steam作为全球最大的PC游戏销售平台,倒是摸索出了一套相对折衷的“组合拳”:同时展示用户评价与Metacritic评分,并提供两小时的退款窗口。退款机制本身又是另一个充满争议的长寿话题,但这套方案至少为玩家提供了尽可能深入了解游戏的机会。


Hello!
我们在为更加闭环、更加高效的服务模式做准备
欢迎加入限定白名单
与我们一起探索





您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存