看懂网络分析,成为高阶球迷
随着复杂网络研究范围的日益扩大,体育竞技也逐渐被应用到其中,尤其是足球和篮球这两项团体运动中。本文梳理了近年来的多篇相关研究,从球员传球风格与球队胜率,到球队风格的量化,再到联赛整体特征,以及体育与社会的关系等,展示复杂网络研究和数据分析技术与体育结合的多种可能。
1. 复杂网络是个框,体育也能往里装?
不管是足球还是篮球,团体性的竞技体育都是涉及几十亿人,数万亿美元的大产业。随着体育比赛的数据化,海量的数据使得数据科学得以在体育产业展示它的魔法。NBA勇士队掀起了利用专业的数据分析提高成绩的浪潮,随着勇士队的连续夺冠,数据分析师已经成为了各个NBA球队篮球教练组必不可少的一员。在足球,网球,排球等其他运动项目上,数据分析也起到了提升球队的比赛的效果。
任何涉及到团队配合的运动,都可以被自然地视为参与者之间相互作用组成的网络。由于竞技体育的胜负是清晰定义的,这使得数据天生就带有标注;而竞技体育中球员特征,例如身高、体重等以及在场上的传球、射门、突破等动作,也是有明确定义的,随着计算机视觉对视频数据的自动标注,海量的数据,使得竞技体育中积累了众多天然的随机双盲实验。这使得研究者得以使用复杂网络的成熟方法学,研究网络结构的变化,网络中的信息传递和网络涌现出的宏观结果(比赛输赢)这三者的关系。
复杂网络在体育中的应用,有广阔的空间。比如除了职业的各种球类运动,对于团队性的电子竞技项目,例如Dota,一些研究方法和结论也是适用的。而在未来,网络分析的框架,还可以整合包括视频、可穿戴设备、体检体测数据等数据源,可以使网络具有更多的层次,从而更好的发挥网络分析的威力。对于非职业的体育项目,随着用户上传数据的增加,也能产生全新的研究方向,例如研究如何避免运动产生的伤病,如何让参加运动的球员相对平均地得到锻炼和发展。
本文将介绍近期的四篇相关研究,视角逐渐放大,先看球员的传球对胜负的影响,再看球队持续的风格如何定量化的考察,之后分析整个联盟在不同时间的整体特征,最后分析体育在社会中的位置,展示复杂网络研究和体育结合的诸多可能方向。
2. 怎样传接球
能让你赢得篮球比赛
论文题目:
SMOGS: Social Network Metrics of Game Success
论文地址:
https://arxiv.org/abs/1806.06696
3. 瓜迪奥拉治下的
巅峰巴萨,有何不同
9月 Nature 子刊 Scientific Reports 上发表的一篇论文,研究者利用网络科学方法,佐证了球迷对主帅瓜迪奥拉旗下的巴萨队(10-11赛季)传球细腻,控制比赛节奏的印象。
论文题目:Defining a historic football team: Using Network Science to analyze Guardiola’s F.C. Barcelona论文地址:https://www.nature.com/articles/s41598-019-49969-2
之后,研究者对比了传统足球分析中用到的指标,例如传球距离50次传球所需的时间,以及网络分析中用到的指标,如聚类系数(cluster cofficient)、最大的特征向量、队中球员的特征向量中心度的最大值等,发现巴萨和西甲其他球队传球网络的平均值,都有明显的差异。
而在进球或者丢球之前,巴萨的传球网络与西甲其他球队也有明显不同。
4. 足球比赛正在变得无趣——
比赛结果爆冷门越来越难了
论文题目:Football is becoming boring;Network analysis of 88 thousands matches in 11 major leagues论文地址: https://arxiv.org/abs/1908.08991
5. 某队球迷数量和
所在城市的人口呈现幂律关系
论文题目:Urban scaling of football followership on Twitter论文地址:https://arxiv.org/abs/1812.04453
这并不意外,但该文章有趣的是分析了球迷人数的增长,在那些国家是超线性的(superliner),即球迷人数的增加比城市总人口的增长还要快,例如城市人口增长10倍,球迷数量增长15倍,这是对应的expnent系数就是15/10=1.5。下图分别展示了印尼(ID),哥伦比亚(CO),墨西哥(MX),西班牙(ES),英国(GB)和美国(US)中,这三个球队的球迷数目和城市人口之间的幂指数大小。
图7:不同国家中不同城市里三只足球豪门的球迷人数增长率
6. 用数据说话,做一个专业球迷
论文题目:
Home Sweet Home: Quantifying Home Court Advantages For NCAA
Basketball Statistics
论文地址:
https://arxiv.org/abs/1909.04817
论文题目: Players’ selection for basketball teams, through Performance Index
Rating, using multiobjective evolutionary algorithm
论文地址:https://journals.plos.org/plosone/article?id=10.1371/journal.pone.0221258
而笔者更关心的是体育和普通人的关系,能否通过大数据的研究,说明体质训练,体质测评的得分和个人的学业,事业成功或创新能力有相关性?或者指出体育锻炼设施多少和城市的经济发展有因果关系?这是更具有普遍价值,也更接地气的研究方向。
作者:郭瑞东
审校:刘培源
编辑:张爽
推荐阅读
集智俱乐部QQ群|877391004
商务合作及投稿转载|swarma@swarma.org
◆ ◆ ◆
搜索公众号:集智俱乐部
加入“没有围墙的研究所”
让苹果砸得更猛烈些吧!