观点/陈友芳:学科任务导向的思想政治学科核心素养测试策略
一、引言
从课程内容属性看,普通高中思想政治课程是一门涵盖哲学、逻辑学、文化理论、经济学、管理学、政治学、法学等众多人文学科与社会科学的综合性学科课程,旨在引导公民的正确政治方向和提升公民的社会参与能力。根据这门课程的培养目标定位、育人价值与课程内容的性质,思想政治课程的学科核心素养包括政治认同、理性精神、法治意识和公共参与等四个构成要素。这四个要素相互交融、相互依存,构成一个有机的整体。其中,“政治认同”决定着学生成长的方向,是“理性精神”“法治意识”“公共参与”的共同标识;“理性精神”是达成政治认同、形成法治意识、实现公共参与的基本条件;“法治意识”是“公共参与”的必要前提,“公共参与”是“法治意识”的必然表现,也是“政治认同”和“理性精神”的必然行为。作为公民培养的目标,对应思想政治素养的四个要素,就是要培养有信仰、有思想、有尊严、有担当的中国公民。
那么,在未来的各类学业水平测试及其他纸笔测试中,如何客观准确地测试学生的思想政治学科核心素养?这是新一轮以“核心素养”为引领的普通高中课程改革中迫切需要解决的一个关键问题。不少人认为,不同于数学、物理、化学等学科的核心素养,思想政治学科核心素养是难以通过纸笔测试加以反映的。笔者的看法则是,正如思想政治学科核心素养存在着难以被纸笔测试的表现特征一样,其他学科同样存在难以通过纸笔测试的核心素养表现特征;正如数学、物理、化学等学科的诸多核心素养表现特征能够纸笔测试一样,思想政治学科核心素养的大量表现特征同样也能够通过纸笔加以测试。那么,由此引出的一个技术性问题是:在纸笔测试中,应该采取什么样的策略来评价学生的思想政治学科核心素养?本文拟运用信息不对称博弈理论对此进行探索,以期推动思想政治学科核心素养评价的研究,同时也为其他学科的核心素养水平的测试提供借鉴和参考,此外,也期望推动评价研究领域中相对薄弱的一个研究环节—评价策略的研究进步。在评价理论与技术的研究中,评价策略研究一般是从心理学、教育学、统计学、测量学角度进行的,本文从博弈论视角对学科核心素养的评价策略进行分析和探究,无疑可以启迪新的评价策略研究视野,提供新的评价策略与技术。
本文首先从信息不对称博弈角度分析关于学科核心素养评价的性质特征及策略性原则,然后再根据这些策略性原则构建纸笔测试下思想政治学科核心素养的具体评价策略。
二、信息不对称视角下学科核心素养评价的性质及策略性原则
简而言之,学科核心素养是个体面对复杂程度不同的真实情境时,运用学科思维与方法、学科知识与技能,分析问题、解决问题的关键能力和必备品格。这是学生系统学习该门学科或课程后所沉淀在其身上的、具有学科特色的关键性成就或标示性特征。
与许多重要特征一样,从测量或评价角度看,学科核心素养具有信息不对称分布特性。一个人的核心素养水平如何,对外人而言,是不可直接观测和度量的,因此,在评价者与被评价者之间,被评价者的核心素养发展水平是他的私人信息,属于两种信息不对称现象之一—“隐藏特征”(Hidden Character)。
在学业测试中,评价者与被评价者之间的关系具有典型的信息不对称博弈性质。一方面,评价者总是试图获得被评价者的真实素养发展水平,并据此对被评价者进行奖励或筛选;另一方面,被评价者总是有积极性“谎报”自己的真实素养水平,即素养低水平层级的人有积极性在测试中通过各种手段(如舞弊、猜题、进行应试训练等)将自己“冒充”为高水平层级的人。显然,这个博弈故事与2001年诺贝尔经济学奖得主斯彭斯(Spence)构建的劳动力市场的信号发送博弈模型高度一致。由此引出学科核心素养评价的第一个基本原则:
原则1:任何有效的核心素养评价均必须考虑被评价者的策略性反应。因为处于素养低水平层级的人有积极性通过各种应对策略“冒充”为高水平层级的人,因此,评价的有效性会极大地受制于被评价者的这种策略性行为。在这种情况下,评价者在选择评价方式、模式以及设计测试题目时不能一厢情愿,而是要考虑被评价者可能采取哪些策略性行为,分析这些可能的策略性行为会对评价效果带来哪些扭曲,并在此基础上作出应对,实施评价。
按照斯彭斯的信号发送博弈模型,被评价者的核心素养水平,作为私人信息,只能通过可观测的信号加以推断。正如在斯彭斯的信号博弈中,雇主可以通过求职者的受教育程度推断求职者的生产能力水平一样,评价者也可以通过学生可观测的行为及其结果(以下称为“行为表现特征”)等各种信号推断被评价者的素养发展水平。因此,从信号发送博弈视角看,学科核心素养评价本质上就是通过可观测信号推断不可观测信息。
要通过可观测信号有效地推断不可观测信息,评价者设置的可观测信号必须要满足“充分性条件”。充分性是指这个或这些可观测信号是推断不可观测信息的充分统计变量。具有充分性的可观测信号必须具备两个基本性质:一是敏感性强,二是随机性小。
敏感性强是指可观测信号与不可观测信息之间有着密切的内在关联,一旦不可观测信息发生变化,就会引起可观测信号的及时变化、强烈变化。可观测信号的敏感性越强,评价者对不可观测信息的推断难度就越小。
通常,可观测信号与不可观测信息之间不会恰好是一一对应的关系,二者之间还要受到许多随机因素的影响。如果二者的关系是一一对应的,从评价角度看,就等于不可观测信息实质上是可观测的。因此,要充分地推断出不可观测信息,就必须尽可能地排除随机因素的干扰。
综合敏感性强、随机性小这两个要求,要充分地推断学生真实的核心素养水平,就意味着评价还应该遵循以下两个基本原则:
原则2:评价核心素养水平的基础性变量应当是被评价者的行为表现特征。一个人的素养水平如何,会通过他的行为及其结果表现出来,核心素养水平与其行为表现之间的内在关联性无疑要高于与其他可观测信号之间的关联。作为评价者,他的核心任务之一就是:从诸多的行为表现特征中,筛选出与某个核心素养及其某个方面具有高度敏感关联的关键行为表现特征。也就是说,评价者要通过大量的实证性研究,针对某个学科核心素养的每个维度,均筛选出能够帮助我们推断其发展水平的关键行为表现指标,这非常类似于人力资源绩效评估中的KPI(关键绩效指标)方法。
原则3:评价核心素养水平的可观测信号不应该是单一信号。为了提高推断的准确性、减少推断中的随机干扰,评价者应该通过同一个可观测信号的出现频率或设置多个可观测信号来加以更准确的推断。这至少意味着两点:第一,用于推断某个核心素养及其某个方面的发展水平的关键行为表现特征应该是一群或一组。例如,我们要充分推断一个人的某方面人品,可能既需要观测他在单位的表现,也需要观测他在社交中的表现,还需要观测他在家庭生活中的表现。又例如,如果一个人能够屡屡发表高质量的论文,显然比偶尔只发表一两篇高质量论文要更能反映其学术研究创新能力。第二,用于评价核心素养水平的可观测信号除了相关的行为表现特征群(组)以外,还必须引入其他可观测信号。在评价某个学生的核心素养水平时,如果不仅看该学生的行为表现,还同时参考学生所处任务情境的复杂程度、新颖程度、难度,或者参考其他同学在相同任务情境中的行为表现,无疑可以对其素养水平进行更准确的推断。
按照上述基于信息不对称博弈理论的三个评价原则:任何有效的评价都是要想方设法让被评价者愿意或不得不“说真话”,即被评价者在评价活动中的行为表现能够披露其真实的素养发展水平。
但是在纸笔测试中,要让被评价者“说真话”并非易事(难以满足“说真话”所必备的“激励相容条件”)[4]。根据上述三个基本原则,要使得被评价者在纸笔测试中“说真话”,获得推断真实素养水平所需要的预期的关键行为表现特征群(组),就必须思考以下问题:哪些学科任务可能帮助我们获得这些预期行为表现特征群(组)?这些学科任务要引出预期的真实行为表现,应该如何设置情境?应该如何选择学科知识?即有效的纸笔测试,必须有机融合以下三者:精心选择学科任务,巧妙设置考查情境,恰当选择学科知识,从而通过让被评价者运用学科知识完成情境中的学科任务,借助任务的完成质量来推断其素养发展水平。
三、学科核心素养与学科任务、情境、学科知识之间的关系
根据上文的分析结论,任何学科核心素养的评价框架应该是一个由四个关键要素构成的四维框架:“核心素养行为表现、学科任务、评价情境、学科知识”。在这个框架中,通过“学科任务、情境、学科知识”的有机整合,在学科任务的完成中,借助任务的完成质量来观察、推断学生的学科核心素养发展水平。
根据我们在教育部学科核心素养测试中的探索,要让这个评价框架是有效的、可操作的,必须进一步深入地、清晰地认识和把握评价框架中四个维度之间的重要关系,才能在以核心素养为指向的测试中,有效地设置相关情境,并基于该情境要求被评价者运用学科知识和技能、学科思想和方法完成某(几)项任务,引发出预期的行为表现,由此证实学生的核心素养水平。因此,确切把握学科核心素养与学科任务、情境、学科知识之间的关系,是合理构建起科学的、能够让被评价者“说真话”的学科核心素养评价框架的基础。
首先,要明晰学科核心素养只能通过可观测的行为表现特征群(组)加以推断
如前所述,对于被评价者来说,唯有借助各种具体学科任务的执行(包括认知方面的任务和非认知方面的任务),才能外显核心素养水平的表现特征,并由此证实学科知识内容能否转化为可迁移到真实问题情境的素养。因此,恰当设置学科任务活动,充当着评价核心素养发展水平的“桥梁”,是测试学科核心素养的基本维度。作为评价者,应该认识到:学科核心素养的行为表现和学科任务活动之间的关系并非一一对应,同一项任务活动可以反映多个核心素养要素及其水平,同一个核心素养要素及其水平也可以通过不同的任务活动反映出来。
其次,要把握情境对展示学科核心素养的意义
评价情境是表现学科核心素养的“舞台”,学科内容只有与具体情境相融合,才能真实地体现出它的素养价值;学科任务只有依托具体情境才能充当诱发核心素养表现特征的途径。对于被评价者来说,唯有凭借这个舞台,运用学科内容应对各种复杂的、不确定的问题和挑战,才能表现自己的能力与品格。因此,巧妙、恰当地设置评价情境,是评价核心素养水平的不可或缺的维度。作为评价者,应该认识到:学科核心素养的表现与情境之间的关系是复杂的,同一个情境可以展现出不同素养要素或同一个素养要素的不同维度;同一个素养要素及其水平也可以通过不同的情境表现出来。
第三,要着眼于学科核心素养具有学科知识的整合性特征
对于被评价者来说,其核心素养是在(跨)学科学习过程中内化于心的学科知识内容的沉淀,是运用学科思维、技能与方法在分析问题、解决问题时展现出来的具有学科特色的关键能力与品格。整合化的、或结构化的学科内容,既是形成和培育学科核心素养的基础,又是评价学科核心素养发展水平的重要维度。作为评价者,应该认识到:各个学科核心素养要素都是该学科所含各课程模块共同培育的结果,不能以为某个素养要素对应着某个课程模块,每个课程模块对培养每个素养要素均是不可或缺的,每个具体素养都是(跨)学科整合性培养的结果。
最后,要明确各关键维度在学科核心素养测试中的功能定位和制约关系。可以这样认为,核心素养要素是评价的起点与依归,学科知识内容是验证核心素养水平的工具,情境是展现核心素养水平的“舞台”,学科任务活动是将内在的核心素养水平外显为可观测行为表现特征的“桥梁”。简言之,学科核心素养的测评方式,就是要实现学科核心素养、学科任务、情境、学科知识之间的融洽与契合。作为评价者,应该清晰地认识到:不同的素养要素会对学科任务、情境、学科知识类型形成一定的选择约束;同时,学科任务、情境、学科知识之间也存在着彼此的制约关系。清晰地认识这种约束、制约关系,在不违背这种约束、制约关系的前提下设计测试题目是实现学科核心素养测试让被评价者“说真话”的关键。
在这个评价框架中,学科任务对评价者推断学科核心素养发展水平具有着核心地位和评价指南针作用,评价者能否获得预期的行为表现特征,主要就看学科任务的选取是否合理,学科任务的设置是否巧妙,是它指引着我们如何去寻找预期的行为表现特征。因此,笔者称这个评价框架为“学科任务导向型的学科核心素养评价框架”。
四、思想政治学科核心素养的具体评价框架构建
接下来,本文基于学科任务导向型的学科核心素养评价框架,具体构建思想政治学科核心素养的评价框架,并结合思想政治学科核心素养测试组的探索与研究,探讨这个框架如何才能让被评价者尽可能“说真话”。
按照学科任务导向型评价框架,思想政治课程确定学科核心素养、学科任务、情境、学科内容作为学科核心素养纸笔测试框架的关键维度。要使得这个评价框架能够实际可操作,能够有效披露被评价者的核心素养发展水平,要求评价者必须完成好以下工作。
1.合理确定每个学科核心素养的构成要素及其关键表现
为了使得思想政治学科核心素养能够被有效地测评,必须明确每一个核心素养的构成维度,再根据这些构成维度,刻画出该素养在每一个水平层级上的关键行为表现,而且这些关键表现要能够用纸笔加以测试,即这个评价框架中只涉及可以纸笔测试的素养表现特征。经过大量探索,思想政治各个学科核心素养的子维度见表1,本文略去每个子维度的关键行为表现特征。
2.科学界定学科任务的类型及影响每一类任务难度的因素
如前面所述,只有综合学生在不同任务活动中的行为表现,才能比较准确地推断出某个学科核心素养的发展水平。考察不同学生在相同的情境中完成学科任务时的行为表现;同一学生在不同情境中完成学科任务时的行为表现,都需要根据不同的任务活动命制各种试题,以区分学业水平的等级。学科任务可以从不同维度进行划分,根据我们从事学科核心素养测试的研究,基于思想政治课程的学科性质和特征,可以采用以下学科任务分类(详见表2),以作为设计不同类型试题的参照。
3.创设源于真实生活的复杂程度不同的各类典型情境
能否在学科任务中诱导出预期的行为表现,关键要看承载学科任务的评价情境是否设置得科学巧妙。根据思想政治学科核心素养测试工作的研究,要使得纸笔测试中学生的应答表现能够尽可能地披露其真实素养发展水平,情境设置应该把握两个基本要求。第一,情境要源于学生熟悉的或能够理解的真实生活。情境是否真实,对学生是否“讲真话”有着至关重要的影响。情境的真实性不是要求评价情境完全照搬和复制真实生活样例。恰恰相反,基于评价目的,评价者应该对真实生活情境进行恰当的删减改造,这就叫做“情境的结构化”。对真实生活情境进行结构化处理就是指根据具体的评价目的和要求、具体学科的性质,剔除真实生活中无关紧要的、甚至会阻碍人们认识情境本质的细枝末节,保留关键性的事实与特征,因此,“结构化情境”就是指对真实的情境进行建模。第二,情境要有典型性。所谓典型情境就是指在测试某个核心素养或子维度时能够获得相关的关键行为表现特征的情境。根据这一原则,思想政治学科核心素养测试先是根据本门课程的特殊性,按照“五大战略部署”把整个现实生活分成五大类情境:经济、政治、社会、文化、生态,在每一类情境中,又再按照“个体的(含个人与组织)、组织内部的、市场的、地区的、国家的、全球的”这五个维度筛选典型情境。
4.要有学科任务的适当重复覆盖与情境的丰富性
基于纸笔测试的天然局限性,再好的纸笔测试也是不完美的。如果只是用一种学科任务或一种情境来测试学科核心素养,被评价者披露的真实素养信息可能非常不充分。要能够比较准确地推断被评价者的素养发展水平,根据思想政治学科核心素养测试的研究和探索,按照前面提出的原则3,在同一次测试中,用于测试每个素养的学科任务应该至少2个以上,即不是根据一个学科任务中的表现进行推断,而是根据多个任务中的表现进行推断。同时,测试情境也应该是丰富多样的,既有高度简化的结构性质良好的情境,又有高度复杂的结构性质不良的情境;既有个体的情境,也有非个体的情境;既有公共生活情境,也有非公共生活情境。这样,既考虑被评价者在不同任务中的表现,又考虑情境的丰富性,再借助现代统计分析技术,可以对被评价者的真实素养水平进行有效的、准确的推断。
五、结语
学科核心素养测试是一个国际性难题。笔者基于这一测试本质上属于信息不对称博弈,运用信号发送博弈模型,提出了学科任务导向型的四维评价框架,并在教育部思想政治学科核心素养测试中加以首次运用,证明了这个框架是可操作的,有效的。但是,这个框架依然需要大量的理论和实证研究来加以完善,例如,用于推断某个核心素养发展水平的关键行为特征有哪些,必须要进行大量扎实的实证性研究;关键行为表现特征与学科任务之家的相关性研究也是极其关键的,即为了获得推断某个素养发展水平的关键行为表现,必须研究设置哪些学科任务是最有效,即什么样的学科任务适合测什么样的素养。此外,为了让学科任务发挥最佳的测试效果,评价者应该如何设计情境、如何筛选学科知识,均需要大量的实证性研究。
本文发表于《课程 教材 教法》2016年第10期
作者简介:陈友芳,1969年生,男,湖南浏阳人,博士,华南师范大学公共管理学院教授,从事公民教育研究,学科核心素养评价研究。
注:关于思想政治学科核心素养之间关系的论述见朱明光.关于思想政治学科核心素养的思考.思想政治课教学,2016(1)
注:隐藏特征,又称隐藏知识,参见Macho-Stadler,I.,and Pérez-Castrillo,J.D. the Introduction to Economics of Information[M](Princeton: Princeton University Press,2001)第一章的相关论述.
注:信号发送博弈模型,最早来自于Spence,M.1973, Job Market Signaling, Quarterly Journal of Economics 87:355-374.
注:信息不对称博弈理论的两大核心问题,分别是如何激励他人对自己的能力等特征“说真话”,以及如何激励他人付出高努力。对这方面内容的权威介绍可以阅读Gibbons,R.1992, Game Theory for Applited Economists[M],Princeton University Press.
注:激励相容条件是人们对自己的特征“说真话”的充分条件。对激励相容条件最全面的介绍和应用可以参见Laffont, J.-J.,and Martimort,D.2002,The Theory of Incen- tives,Princeton University Press.
编辑:方凌雁