游戏化人格测试：一种新兴的人格评估模式

黄逸飞精神障碍AI诊疗山西省重点实验室 2023-05-13

论文导读

游戏化人格测试：一种新兴的人格评估模式

发表于Personality and Individual Differences

背景

人格描述了人们与物理和社会环境互动时相对稳定的思考、感受和行为风格。人格通常被认为是一种稳定的结构，它可以指导个体应对所遇到的事件。

而目前对于人格的测评，通常采用自我报告问卷的方式进行，即被试在问卷中指出一系列项目是否或在多大程度上准确描述了他们的人格。自我报告问卷调查方法有不少优点，如快速、简单、可靠。但也有一些缺点，如被试可能对测验的问题产生误读或误解，也可能因粗心、不感兴趣而消极应付问卷，这样就会使得最终的结果偏差较大。而游戏化是指在任务或活动中添加与游戏相关的元素，使得过程更具吸引力。这就提供了一种避免传统人格评估常见问题的方法，并有可能获得比传统问卷更真实和准确的数据。

本研究通过创建和开发一款基于文本的游戏，并将结果与现有验证良好的人格问卷进行比较，探索游戏化人格评估的有效性。

方法

1 开发工具

设计的游戏是一款文字冒险游戏，背景设定为主角被困在地下隧道，玩家对主角在遭遇不同场景时的行为进行选择，通过选项的不同来评定玩家的人格。玩家需要从每个选项中选出最有效的行为，以达到逃离隧道的目的。每个项目的各个选项都是精心设计，用以表征五因素模型(Five-Factor Model, FFM)的一个因素。游戏中部分选项的设计与国际人格项目库(International Personality Item Pool, IPIP)相对应，见表1。

2 预实验

成立一个由11位专家组成的评定小组，该小组由路易斯安那州的工业/组织心理学教授和实践者组成。通过专家评定法，让专家们对90个选项进行筛选，选出他们认为能够代表五因素的选项，并使用组内相关系数(ICC)检验它们的信度。

原始游戏所有选项的平均ICC较差(ICC = 0.58)，低于预期。在初筛后，为了更清楚地表达预期的人格特征，将重新调整27个选项的措辞，直到对项目选项因子链接达成共识。在研究1中，使用的游戏版本(包含原始的63个选项，及其余27个改至满意的选项)表现出较高的信度(ICC>0.70)。

研究 1

1.被试

在第一次测试中，作者从Reddit网站上招募被试。该网站上有一个收集实证数据的子版块，研究者可以在此上传问卷并用于研究。在这个研究中，共招募被试207名，其中有77人完成了整个研究。在这77人中，63.6%是女性，81.8%是白人，37.7%完成了大学教育。

2.方法

被试经过知情同意后，开始游戏化人格测验。该游戏的最终得分为每选择一个选项所对应的分数之和(范围为0~12分)。紧接着，让被试进行IPIP-50的测试，该问卷共包含50个问题，采用李克特5点计分法(1=非常不准确，5=非常准确)。

3.结果

为了评估该游戏的聚合效度，使用Pearson相关系数将游戏得分结果与IPIP-50进行比较。相关分析结果如表2所示，两种测量工具之间除开放性(r = 0.20, ns)外，其他因素均显著相关。神经质的相关性最显著(r = 0.48, p<0.05)，其次为外向性(r = 0.42, p<0.05)，尽责性(r = 0.38, p<0.05)，最后是宜人性(r = 0.36, p <0.05)。

4.讨论

对于IPIP-50这样的调查而言，因为它有非常大的公众样本量，所以每个因素的总体平均分应该相当平均。但是在研究1的样本中，IPIP-50的平均得分并非如此(平均分范围为1~5)，平均分从3.98(开放性)到2.35(外向性)不等(见表3)。这似乎可以说明通过Reddit招募的被试缺乏代表性，因为那些选择通过互联网参与社会互动的人往往在人格评估中外向性得分较低。

通过此次研究还发现，有一些选项的被选比例非常高，在仔细检查了受影响的选项后，作者发现主要区别在于该选项是否会推动游戏发展。推动故事情节发展的选项更受被试青睐。因此，对每个选项都进行了重新审查，开发了第二版游戏，以确保所有选项都具有同等的可取性。

研究 2

1.被试

在第二次测试中，被试为路易斯安那州一所大学的本科生。被试包括98名本科生，其中大部分为女性(80.61%)，年龄为22 - 25岁(96.94%)，有72.45%是白人，所有人均为在读大学生。

2.方法

除了在对游戏有影响的一些选项上进行了调整，其他部分与研究1相同。不同之处在于，被试由原先的Reddit用户变为了在校大学生。他们将亲自到线下测评室进行测试。

3.结果

这个版本的游戏在5个因素中的3个与IPIP-50显著相关。外向性(r = 0.42, p<0.05)、宜人性(r = 0.25, p<0.05)、尽责性(r = 0.20, p<0.05)之间显著相关。神经质(r =−0.004, ns)或开放性(r = 0.13, ns)无显著相关性(表4)。

4.讨论

在研究2中，作者改变了研究1中高频选项的措辞，并使用了不同的人群。结果与研究1一致，表明一个简单的基于文本的游戏是可以有效地衡量个体的人格。研究2中游戏和IPIP之间的相关性较弱，部分原因可能是使用了更同质的大学生样本。

研究1和研究2相比，它们的每个选项代表不同的人格特征，而IPIP-50和大多数其他人格问卷报告的是对于被试的某个人格因素的描述程度(1~5分)。将游戏化人格测量也改为传统人格测验的评分方式，是否会提高两者之间的相关性。为了进一步探索这一点，作者改编了研究1和研究2中的游戏，开发了一个新的游戏版本。

研究 3

1.被试

研究3的被试也是通过Reddit招募。共有579人参与了调查，338人完成了研究。在这338名被试中，55.8%是男性，76.1%是白人，37.8%至少接受过大学教育。

2.方法

对游戏选项设计进行更改，在研究3中，每个项目后面有三个回答选项，而每个选项都代表了相同的人格因素，但水平不同。例如，项目为“前方的隧道中出现一个黑色的人影”，在研究3中，这个项目是用来评估外向性(E)，被试必须在以下行动路线中选择:“使用通信设备打招呼并介绍自己(高E)”；“继续慢慢向前走，看看人影如何反应(中等E)”；和“尽量避开那个人影，看看它是否离开(低E)”。

3.结果

这个版本的游戏在5个因素中的4个与IPIP-50显著相关。外向性(r = 0.43, p<0.05)、宜人性(r = 0.32, p<0.05)、神经质(r = 0.21, p<0.05)、开放性(r = 0.32, p<0.05)之间有显著相关。尽责性无显著相关(r = 0.06, ns)(表5)。

4.讨论

与之前的研究不同，在研究3中尽责性并不显著，这可能是对分数解读不同的结果。在研究1的游戏中，分数代表了选择与某一特征相关的行动过程意愿。在研究2中，分数表示愿意选择与某一特质高水平相关的行动。在游戏中，玩家可能会认为更有责任心的行为是最佳。由于对每个选项措辞的调整，可能会改变被试对于行为的理解，有些特征可能更难用文字表达出来，之后还需要更多的研究。

总讨论

在三项研究中，作者发现游戏测试和传统问卷测试之间的几个人格因素相关是一致的。这表明游戏化的测量方法可以用来准确地评估人格。通过增加被试的参与感和对任务的兴趣，游戏化的测量方法可能更适合被试虚假和粗心反应的情况。未来对游戏化人格评估的研究应该讨论其与传统评估方法的聚合效度，以此来衡量该方法的有效性。在研究3中，作者改变了选项的结构，认为与传统方法更相似的评分方案可能会产生更大的相关性，但这种推理并未得到证实，因为人格测评的最终目标是准确地衡量个体的人格，而不是完美地反映现有的衡量标准。

思考

游戏化人格评估是一种很有前途的工具，可以用来改善传统人格问卷中存在的一些问题，如被试粗心回答。同时，如何将游戏内的参数更精确、高效地转化为我们所需的数据，也是未来研究关注的重点。此外，还可以开发单一人格因素的游戏化测验用于更高效地进行人员选拔。

原文：

McCord J L, Harman J L, Purl J. Game-like personality testing: An emerging mode of personality assessment[J]. Personality and Individual Differences, 2019, 143: 95-102.

翻译：黄逸飞

审核：李月

排版：张昊翔

薄公子低调成台湾女婿 23日已在台举办婚礼

警察殴打打人学生，舆论撕裂的背后

你手放哪呢，出生啊

故宫蛇年限定款藏书票，错过再等12年！

“湿冷魔法”攻击！鸟家三合一冲锋衣、羽绒服、软壳裤帮你抵挡

游戏化人格测试：一种新兴的人格评估模式

您可能也对以下帖子感兴趣

薄公子低调成台湾女婿 23日已在台举办婚礼

警察殴打打人学生，舆论撕裂的背后

你手放哪呢，出生啊​

故宫蛇年限定款藏书票，错过再等12年！

“湿冷魔法”攻击！鸟家三合一冲锋衣、羽绒服、软壳裤帮你抵挡

生成图片，分享到微信朋友圈

游戏化人格测试：一种新兴的人格评估模式

您可能也对以下帖子感兴趣

你手放哪呢，出生啊