《Nature》最新研究:大数据预测你的偶像何时凉?
By 超神经
场景描述:最新发布在《Nature》子刊上的一篇论文《Quantifying and predicting success in show business》,通过搜集分析影史依赖,一百多万名演员的作品和发展数据,推算出影史演员的职业生涯发展特点,和个人的发展规律。
关键词:量化数据 职业生涯发展 平均模型
最近一项发表在《Nature》子刊 Communications 中的研究引起了科学界和演艺界的广泛关注,来自伦敦玛丽皇后学院数学系的几位研究人员,发布了一篇关于《通过量化方法,预测演员事业发展周期》的文章。
这项研究的数据,搜集了从有记录开始,到 2016 年1月16日,在 IMDb 上 1512472 名男演员,和 896029 名女演员的职业生涯记录。
其中最早的数据,可以追溯到 1888 年。在研究中,他们总结出了一些特征,也很有趣,也很值得思考。
昙花一现:大部分演员的宿命
这是研究团队,通过定量分析这些数据,得到的第一个结论:有大量的演员,只在自己职业生涯的开端有过作品,此后就是长久的沉寂。
他们也许有职业方向的调整,但也都因为在影视行业中,优质作品和优质角色,本身就是一种非常稀缺的资源。
奥斯卡获奖作品《爱乐之城》讲述了好莱坞演员梦
研究团队认为,在演员的职业生涯中,90% 的时间是处于失业状态的,并且只有 2% 的演员能够通过演出报酬,来养活自己。
在分析演员的职业生涯中的累积财富时,也体现出了非常明显的马太效应,即群体中的少数人手中,聚集着行业中绝大多数的资源。
研究发现影史上约有 100 多位男演员,他们集中了有史以来约 80% 的电影资源。
女演员的尴尬:全球影视业的通病
Annus mirabilis 是在欧美文化里的一个概念,直译到中文语境里就是「奇迹时刻」,在一项学科获得快速和重大突破的时刻,就称为 Annus mirabilis 。
在本文中,也指一位演员的职业生涯最辉煌的阶段,也有高光时刻的意思。比如 90 年代的赵薇,千禧年的 F4,他们的职业生涯里都展现出了很明显的奇迹年特征。
这项研究中,在统计和分析所有从业 20 年以上的演员作品数据后,发现了两个特征:
男演员拥有更多的角色机会,而且一个男演员的演艺生涯里的 Annus mirabilis 奇迹时刻,可能出现在他职业生涯的任何时段;
女演员不但在工作机会上,远少于男演员,而且对于她们来说,演艺生涯的 Annus mirabilis 奇迹时刻,对于大部分女演员来说,都只发生在年轻、职业生涯刚开始的时候。
如图为该篇论文中的部分研究方法:
L:为演员职业生涯时长;
S:为演员有作品的年数,数量以每年 IMDb 的记录为标准;
k:为该演员当年的作品数量;
n:为该演员的作品生产效率;
如图片示例中是一名男演员,其职业生涯共计 L = 23年,并且在有作品的 12 年中(s = 12年中)累计有 17 个作品( n = 17 )。
可预测的奇迹时刻:爱豆何时走花路?
这些研究结果,也不单单针对于群体,在研究中通过百万级演员职业生涯的数据,研究人员还定义出了一个平均模型:
如图:
ξ(κ):表示计算年偏离奇迹年的作品;
κ :表示与奇迹年的偏离值;
这个模型,可以根据某个演员已经产生的数据,推算自己的奇迹年。
也就是说,当我们想测算某个演员,还有多久可以到达自己的职业生涯巅峰,只需要根据 ta 之前的从业数据,套入这个模型中,来推算 ta 还有几年到达、或者已经发生过了自己的 Annus mirabilis 奇迹时刻。
选秀节目出道的杨超越,带来了「锦鲤」热潮
如果算出 κ 的偏离值在 0 以下,则说明这位演员还有 κ 年就要大火!
如果 κ 大于 0,则说明这位演员,可能已经度过了自己的奇迹时刻,未来将有可能进入平稳发展的阶段。
据该研究的团队表示,目前这个模型的准确率已经接近 85%,团队也希望能够对演艺界有所参考。
数据量化的演员发展:瞎说什么大实话
在娱乐圈,有一句话「小红靠捧,大红靠命,强捧灰飞烟灭。」描述演员的职业发展的规律,网络中也有不少命理师,依靠给明星、商业大佬推算运势,而被粉丝们关注。
命理师的推演也很有趣
无论是基于八字的命理推演,还是影视发展至今的历史数据,都是遵循着自己学科体系下的规律和经验,得出的暂时结论。
比如命理推算是推演出趋势,而量化数据,则是归纳数据中表现出的某些特征。但这些结论不等于结果,结论也不代表观点。越发开放的平台和舆论环境,审美和要求都愈加提高的观众,才是对此最有评判资格的。
最终,一个演员职业生涯的成功与否,取决于个人的作品质量,这源于演员个体的努力程度,并不会受任何既定规律的限制。
参考内容:
[1].《Quantifying and predicting success in show business》2019.6月发表于 《Nature Communications》;
[2].《 Mathematicians work out how to predict success in show business》2019.6月发表于 ScienceDaily;
超神经数据集
Netflix 电影评价数据集
Netflix 数据集是一个有关电影评价信息的数据集。该数据集中包含随机挑选的 48 万 Netflix 客户,对 1.7 万 部电影,超过 1 百万 条评价,数据时间段为 1998.10 到 2005.11。
评价以 5 分制评分为基准,每部电影评价为 1-5 分,客户信息进行了脱敏处理。该数据集来自于 netflixprize,netflixprize 比赛旨在大幅提高有关某人根据自己的电影喜好欣赏电影的预测准确性。该比赛由 2006 年持续至 2011 年。
HyperAI 超神经搜集并整理全球数百个公开数据集,还提供国内镜像下载,对科研机构和开发者们提供免费服务。
更多有关影视信息的数据集,请访问 https://hyper.ai/datasets 或点击阅读原文获取。
历史文章(点击图片阅读)
「破冰行动」虽收官,毒品犯罪何时完?
如何用技术帮王源们戒烟?
本届戛纳最佳编剧——得主依然是人类
AI 百科
教程
数据集
商店
更多
http://hyper.ai