促进共同发展：同伴评价的历史考察、现实路径与未来方向

人才发展专委会

2024-10-05

The following article is from 教育测量与评价 Author 熊颖雷浩

来源 | 教育测量与评价

★ 本文原载《教育测量与评价》2021年第9期

作者简介

熊颖：华东师范大学课程与教学研究所硕士生，主要研究方向为课程与教学评价、学生学习与发展。

雷浩：华东师范大学课程与教学研究所副教授，博士，主要研究方向为课程与教学评价、学生学习与发展等。

摘要

同伴评价作为新的评价形式，不仅符合核心素养测评对评价工具的要求，更具备学习功能。其发展经历了由疏离教育领域、聚焦学习结果的评价工具、聚焦学习过程的评价工具到作为学生参与学习的工具等变化。同伴评价的实施需要操作模型支持，最新的同伴评价操作模型包括12个操作步骤，具有形成性评价与学习工具的功能，是教师完整实施、实现同伴评价功能的重要保证。未来的同伴评价研究将聚焦核心素养培育，进一步强调同伴评价的学习功能；优化操作模型，增加同伴评价的使用情境；增加实证研究，深化同伴评价的信度和效度。

关键词

核心素养；同伴评价；历史考察；现实路径

教育评价，尤其学生评价，是人才培育不可或缺的环节。学生评价是指根据一定标准，通过使用一定的技术和方法，以学生为评价对象所进行的价值判断，主要功能体现为诊断性、总结性或形成性评价，对学生学习成果或目标具有诊断、鉴定、监控、导向或改进的作用。[1]随着基于核心素养的课程改革的推进，学生评价逐渐呈现多元化特征，并且受到研究者们的广泛关注。然而，同伴评价作为一种重要的学生评价方式，在教育研究中却并未得到相应的重视。传统教育评价方式功能单一，主要以总结性评价对学生的知识与技能进行考察，并不能促进学生学习。而同伴评价功能多元，既可作为总结性评价的工具、促进学习的评价手段，也可作为促使学生学会评价他人与自我的学习工具，从而实现学生的“真学习”。再者，同伴评价可解决在以往评价活动中学生常作为孤立的评价对象的问题，学生可打破评价阶级，在特定的形成性同伴评价中实现同伴合作学习。更为重要的是，作为学生参与学习的方式，同伴评价可落实核心素养，发展学生应具备的、能够适应终身发展和社会发展需要的必备品格和关键能力。可见，同伴评价不仅可作为评价工具为学生提供反馈与指引，更能成为学生学习的工具实现深度学习与终身学习。那么，同伴评价经历了怎么样的历史发展与功能演变？最新的同伴评价操作模型又是如何发挥作用的？同伴评价的未来发展方向如何？本文尝试对这些问题加以探究。

一、同伴评价的历史考察

通观同伴评价（peer assessment）的发展史，同伴评价与教育领域之间经历了由疏至亲的过程。自同伴评价正式进入教育领域以来，随着人才观、教育观的变迁与发展，同伴评价的内涵也随之深化和拓展。

1. 同伴评价的起源

早在1774 年，与同伴评价相似的教学形式同伴批改（peer editing）就已出现在格拉斯哥大学哲学教授乔治·贾丁（George Jardine）的课堂，该教学形式的主要目的是为了解决写作课上学生人数过多的问题。虽然同伴批改被视为同伴评价的雏形、合作学习的基础[2]，但由于那时的同伴批改主要是为了节省时间且缺乏具体的实施步骤，在教育领域仅仅昙花一现。直至1934 年，莫雷诺（Moreno）提出社会测量法[3]，作为社会测量的同伴评价才重新回到人们视线，其表现形式为“同伴提名”（peer nomination）或“同伴评定”（peer rating）[4]，目的是测量社会群体间的人际关系及其相互作用。此时的同伴评价更关注其社会功能，即同伴们表达的是对彼此的喜恶态度以衡量或预测彼此的社会地位信息，在这个时候，测量标准与规范性被首次提及，这是同伴评价作为评价方式的伊始。同时，同伴评价的省时优势被迁移并运用至心理测量，“同伴评估”（peer evaluation）由此产生，且测量对象发生转变，由测量群体间关系转为测量群体中个体的情感适应、兴趣、态度等人格特点。二十世纪四五十年代，心理测量如日中天，而作为心理测量方式之一的同伴评价更是呈现出测量内容具体化和多样化、测量标准客观化的特征，同伴评价的更多功能亟待探索。

2. 聚焦学习结果的同伴评价

20 世纪50 年代末，苏联发射的第一颗人造卫星使美国感到威胁，这促使美国开展大规模的教育改革。政府和民众迫切要求对学校办学成果进行鉴定与报告，以泰勒为主导的教育界仍以教育成果为主要评价内容。但同时，以布鲁纳（Jerome Seymour Bruner）为代表的教育研究者，提出了“倡导学生成为学习的主导者”[5]的观点，引导着同伴评价走进课堂。不过，此时的同伴评价有些青黄不接，其不确定性和风险性使之与中小学课堂仍存在距离，但在职业院校却蓬勃发展起来。而且，由于同伴评价理论未完全脱离心理测量，教育实践仍沿袭原先的测量实践，聚焦学生的学习结果，这体现在这一时期同伴评价的目的和方法上。

从目的来看，同伴评价聚焦判断知识掌握和技能熟练的程度。在20 世纪50 年代末的教育改革背景下，几乎所有教育活动都以成果为导向，所有评价手段包括同伴评价都以评价知识与技能为目标。[6]形成此目的的原因主要有三。首先，此时同伴评价的实践背景具有特殊性，多发生于职业院校，对其学生，如未来的医护人员、飞行员、警察等，要求具有强实践性、高标准性及强综合性知识和能力的掌握及运用水平，与此时同伴评价对学习效果与成果的描述、判断甚至预测等相适应。其次，虽然提倡学生在学习中主动建构知识，但在对学生进行学习评价时，由来已久的考试文化仍是评价的主流趋势，同伴评价形式虽新，但其内核承载的依然是主流评价的目标，评价目的依旧是对学生的成绩进行判断，从而区分优劣、分出等级或检定合格。最后，相对已较为完备的教师评价学生的体系，此时同伴评价的运用仅被视为其补充，只能作为总结性的附加评价，对同伴评价的信度、效度研究也多聚焦于探讨使其功能向教师评价学生体系靠拢。[7]

从方法来看，同伴评价尤其是其反馈形式也表现出高度的总结性。凯恩（Kane）和劳勒（Lawler）（1978）在同伴评价的文献述评中表明，同伴评价是一种成就或表现的评价形式，包括同伴提名（peer nomination）、同伴评定（peer rating）及同伴评级（peer ranking）3 种评价方式。[8]在此前的实践中，同伴评定往往在课堂结束时发生，其反馈方式主要以分数或行为定位等级法等量化手段，简单地对学习者的表现进行高度概括，指向鉴定与分等的目标。

3. 关注学习过程的同伴评价

1969 年，本杰明·布鲁姆（Benjamin Bloom）首次将形成性评价引入学习领域，并指出：将这种与分数脱离的评价用于辅助教学，能更有效地促进学生学习。此后，受人本主义思想的影响，教育呼吁以个人成长与发展为最终目的、尊重学生个性化评价的发展。在建构主义学习观与情境认知观等多元教育观影响下，学界对强调学生学习主观能动性及评价情境真实性的形成性评价的需求递增，同伴评价的形成性功能也随之发展起来。1986 年，韦弗（Weaver）和科特雷尔（Cotrell）通过个案研究指出，同伴评价不仅具有总结性功能，也具有形成性功能，他们认为同伴评价不仅是一种良好的打分方式，还可以促进学生参与、强调技能、聚焦学生学习过程、提供评价标准和反馈，以及提高学生成绩。[9]1998 年，托平（Topping）首次对同伴评价进行较为全面的概念综述、理论建构和实践展望。[10]同年，布莱克（Black）和威廉（William）的形成性评价综述表明课堂实施形成性评价对学生学习效果有显著提高的作用，形成性同伴评价的课堂实践与研究开始增多。

聚焦学习过程的同伴评价的一个特征是评价内容的转变。这一时期的同伴评价盛行于高等院校，其丰富的专业使得评价内容逐渐多样化与复杂化，如评价科目从单一实践或理工类逐渐囊括人文社科，评价内容涵盖写作、口语、专业表现及小组项目等。多样而复杂的评价背景与实践促使同伴评价的内容由专注单一的测试、分数或等级评价走向注重学生表现等更多元全面的评价。1998 年，托平给出了最广为学界认同的同伴评价概念——“一种组织活动，这种组织活动使学习者思考和明确与他们相同水平学习者的学习产物或学习表现的水平、价值或质量”[10]。在此后近十年里，学者们都沿用托平关于同伴评价的概念。2013 年，托平明确“行为”的内涵，这表明同伴评价概念逐渐向形成性评价转向。[11]

聚焦学习过程的同伴评价的另一个特征是反馈形式的变化。1995 年，南希·费尔奇科夫（Nancy Falchikov）指出，同伴评价反馈（peer feedback）是促进学习的关键，且这种反馈并不是简单的量化式评分反馈。[12]反馈并不一定发生在课程结束时，可贯穿整个学习过程；反馈侧重评价结果的分析性，以更为详细开放的质性评价呈现，其具体表现形式主要为强化型、说教型、纠正型及建议型，特点包括反馈及时、数量多、内容丰富、可交流等。[13]在反馈过程中，同伴评价者和被评者要同时参与，被评者得到同伴评价者详尽的反馈信息及反馈依据，双方展开讨论后被评者针对反馈信息做出回应。这一时期的同伴评价反馈并不寻求对学习结果的高度概括，而是尝试用分析的视角让被评者通过反馈改进学习。在此基础上，研究进一步证明同伴评价不仅可以促进被评者学习，其本身也可作为学习方式，同时促进所有参与者的学习。

4. 作为学生参与学习方式的同伴评价

自同伴评价对学习的促进作用受到广泛关注后，学者们提出评价对学习的支持作用不只是授之以鱼，更是授之以渔，即同伴评价不仅可以促进学习，更可作为学习的工具和学习如何评价的工具。[14][15][16]托平通过对同伴评价过程尤其是学生评价过程培训和评价反馈进行综述，指出同伴评价背后的学习理论是维果斯基（Lev Vygotsky）的社会文化发展理论和皮亚杰（Jean Piaget）的认知冲突的平衡理论，他认为学生通过认知与元认知、沟通合作及情感收获等实现同伴评价，这里的同伴评价就是作为一种学习方式起作用的。[10]

作为参与学习的方式，同伴评价可以促进学生的认知与元认知的发展。基于详细反馈的形成性同伴评价更关注被评者的认知发展，以持续促进被评者的学习结果为目的；而作为学习工具的同伴评价关注评价者与被评者双方认知与元认知的发展，学生通过认知与元认知进行学习，从而实现深度学习和终身学习。

对于被评者来说，反馈能引起被评者的认知冲突，而被评者还要对反馈进行总结归纳、互动交流及回应，因此，被评者要在语言和思维交互发展中多学习，以更好地表述思考与讨论学习质量。而对于评价者的认知来说，提出恰当且可评价的问题、制定同伴评价标准及评价作品的过程中都会引起评价者认知冲突，评价者可通过教师和同伴的帮助跨越“最近发展区”实现高质量的学习。元认知可实现批判性学习和终身学习，这是同伴评价中常见的学习手段，也是同伴评价区别于其他评价的显著特征。当评价同伴时，评价者根据评价标准诊断、识别及更正他人作品，这只有通过运用主体知识、任务知识及策略知识才能实现，涉及了元认知层面的监控与调节。不仅如此，同伴评价的标准和技能都可以迁移，评价者可通过同伴评价学会如何评价[17]，更重要的是，能促进学生的自我评价（self-assessment），同伴评价的自我检测和管理就能证明自评也在同时发生[18]。养成自评习惯有利于学习者摆脱学习依赖，积极参与学习，加强学习过程的自我管理与调节，从而对学习结果不断适应、修改与调整，成为终身学习者。

同伴评价的另一个显著的学习功能是能促进学生沟通能力的发展。同伴评价中的沟通既能搭建学习的桥梁，也被视为学习的“目的地”。同伴评价对评价者与被评者的沟通技巧要求高，若学生对概念掌握不足，就需要通过相应的解释，将思想具体化为语言，口头交流技巧、表达技巧和社交手段也就得以发展。接受交流反馈后，学习者可反思给予与接受批评、佐证自己立场及拒绝他人建议等社交技能。同伴评价因其丰富的情感体验还能激发和加强学生学习的内在动机。

首先，同伴评价真实的情境能将学生学习的内容与个人任务建立强联系，同伴评价的平等关系能打破评价中由来已久的评价者与被评者关系不对等和二元对立所带来的焦虑与紧张，能在极大程度上建立彼此的信任感，真实、安全与值得信任的评价环境使学生敢于暴露、面对与剖析自己的无知、问题与错误。

其次，在同伴评价过程中，直接参与学习活动的经验，能促进和培养学生的主人翁意识，增强个人责任感[19]；互动交流可以使参与者加强彼此的认同与联系，增强共情能力及自我效能感；而在评价反馈中，正反馈经验能减少参与者面对评价时的焦虑，并提高其对负反馈的接受度。[12]同伴评价的正反馈能将学生从被动的状态中解放出来，促进参与者积极主动参与学习，并进一步检测、管理和更正他人及自己的学习。

通过对同伴评价历史演进的梳理和分析我们可以看出，同伴评价功能的发展受到社会、教育与同伴评价自身发展等的影响，经历了由社会心理需求主导发展到现实教育需求主导，功能由单一转向多元，实践目的越发明确，实践方法也逐渐规范化。

二、同伴评价的现实路径

前文从历史角度分析了同伴评价概念与功能的演进，对本论文所探究的核心问题进行阐释。在此基础上，本研究将对同伴评价的操作模型进行剖析，以探究同伴评价操作模型为何出现、具体的要素是什么、步骤和内容包括哪些、在操作时又应注意什么问题。

1. 操作模型在同伴评价中的作用

操作模型如脚手架，教育实践者可据此实现同伴评价的落地。自社会测量开始，学者们对同伴评价方法和操作模型的讨论热度只增不减，由于评价的目的、对象以及背景有差异，讨论的同伴评价操作模型的要素、结构与流程也有所不同。直至1998 年，较为完整的同伴评价操作模型才开始出现，此后，经历二十余年的改进与发展，托平于2018 年研究出最新的同伴评价操作模型。该模型能清晰完整地呈现同伴评价的要素与流程，从而保证实施质量，成功实现同伴评价的目的与功能。

许多研究表明同伴评价能够对教育教学起作用，然而，另一方面，也有证据表明同伴评价可能无法实现其应有的作用且随之而来的是无法承担的代价。通观同伴评价无法实现其应有作用的证据，笔者发现，是因为这些同伴评价的实施缺乏全面细致的组织。同伴评价组织即操作模型，它通过保证要素全面性和结构完整性实现同伴评价的目的与功能。同伴评价运用的多样化导致其包含的要素趋于复杂多元，这对于未实施过同伴评价的教师而言是一个大挑战，往往会出现同伴评价实施要素缺失、赘余或与目的匹配度低等情况。

最新的同伴评价路径囊括同伴评价功能、对象、参与者、形式、背景及对同伴评价的评价等相关要素，其完整性能帮助教师把握同伴评价变量的全景图，避免实施同伴评价时由于要素的缺漏、片面或赘余而产生的课时浪费或无法达标等问题，教师也可根据情境选取所需要素。操作模型还可以提供完整的实施流程结构。托平的同伴评价路径清晰介绍了同伴评价的12 个主要步骤，结构清晰、紧密相扣，具体包括目标确立、参与者分配、辅助材料选取、同伴评价训练、过程监督，等等。教师可采用操作性强的模型引导学生开展和实施同伴评价，规范的评价流程也可降低学生对复杂无序评价过程的排斥；而且，具有完整性的模型可重复循环地实施，从而得到较为一致的结果，指导同伴评价确定目的、功能和调整操作的要素，保证同伴评价的信度与效度。

1998 年和2009 年，托平等人两次提出了操作模型，但两个模型都以步骤指导为主，所提供的要素极为有限。其中，1998 年的操作模型为同伴评价实践的最初模型，关注学习结果和作为学习的同伴评价功能虽已被提及，但实践仍主要关注同伴评价的总结性评价功能，操作模型主要关注学生匹配成组、学生对同伴评价熟悉度训练以及评价的信度与效度；而2009 年的操作模型虽逐渐展现促进学生学习的特征，但托平等人的本意仍为对同伴评价的评价功能进行关注，较1998年增补的是对同伴评价与教师评价的信度、效度的对比以及让学生参与评价标准的制定，并未对学生的任务或对整个同伴评价过程的反馈提出要求，且让学生参与标准制定是为了使学生产生归属感、降低学生的焦虑，并无使学生从中学会评价的目的。2018 年最新的同伴评价操作模型则强调以下几点要求，如强化学生参与评价标准的制定、以学习为目的、评价过程中要有初步反馈、对整个评价活动的反馈提出要求、突出同伴评价开展的背景及参与者背景等，其目的在于通过同伴评价实现学生参与学习这一功能；不同背景与目的下，同伴评价的功能还可变化调整，可从总结性、形成性及作为学习方式三种功能中择其一或自由组合。

2. 同伴评价最新操作模型的具体步骤与相关决策

自1998 年以来，随着教育背景多元化及教育手段信息化的推进，以托平为代表的研究者构建的同伴评价操作模型经历了3 次改进与发展，与早期模型相比，最新模型呈现出要素多元化、步骤具体化、指令明确化等特征。托平指出，当学生作为评价者时，教师需更审慎地选择和考量设计要素与步骤，以确保同伴评价成功实施，因此，托平将实施中应思考的问题也一并提出，教师可根据具体情景进行选择和调整。以下是托平在2018 年提出的同伴评价路径[20]：

●背景——①学校背景；②该情境下的特定问题（同学或族裔关系）；③明确支持者。

●目的——①评价功能（总结性或形成性，或皆有，或由总结性走向形成性）；②可观察、可操作、可测量；③与学生（初步确认）课程领域；④针对相关领域（认知、元认知、情感、社交收获等）；⑤对评价者；⑥对被评者。

●课程领域及被评者——①课程领域具体化：阅读（口语/识字/理解）、语言（表达型/接受型）、思维技能、写作（创作型/技能型）、数学、科学、信息素养技能等领域；②评价对象：写作、画作、口语、小组作业、行为表现。

●选择与匹配评价者与被评者——①介绍同伴评价；②参与者结构要素（班级内或班级间，全班或仅小组）；③参与者背景要素（学生有无同伴评价经历？已有同伴评价经历影响如何？参与同伴评价的熟悉度、工作习惯、合作精神如何？）；④固定安排或随机匹配参与者；⑤根据基本信息（包括年龄、年级、人数、性别、能力、评价和被评规模、同伴偏好、同伴评价互惠性）安排；⑥辅助评价实施人员；⑦招募同伴评价者的方法及是否要激励或强化（评价者或被评者）；⑧同伴评价公开或保密；⑨同伴评价彼此匿名或署名。

●帮助手段（实施者要明确的问题）——①任务复杂性：简单或复杂？或由简单至复杂？②评价标准：标准是否明确？学生是否参与制定标准？有无评价标准参照表？③同伴评价形式：线上或线下？同步或延时？④反馈：提问在反馈中的作用？反馈数量多少？口头形式反馈还是书面形式反馈？反馈是详尽具体还是简洁笼统？反馈为正反馈或负反馈，或皆有之？反馈为定量或定性，或皆有之？反馈为强化型、建议型、教导型还是纠正型？⑤同伴评价修正：学生是否清楚需要再次进行同伴评价？修正内容多还是少？简单修正还是复杂修正？高度结构化的活动是一开始就发生还是向学生解释后？⑥相关帮助技能：展示、解释、演示、检查、过程监督、教师评价、反馈、修正补救；⑦相关社交技能：建立融洽关系、分享兴趣爱好、口语或非口语社交技能；⑧鼓励。

●联系——①有计划或按所需进行同伴评价？（若为后者，如何保证方法流畅度）②全班同时还是小组轮流？③时间：是课上、课下，还是放学后？全班固定时间或可调整？④地点：校内还是其他地方？教室、休闲场所或其他地方？是否在校外？（家中、社区中心或图书馆）⑤时长：选择15分钟、20 分钟、30 分钟、45 分钟还是60 分钟？⑥频率：6 周、8 周还是10 周？一学期或更长？⑦问题：跨年级/班级/机构要如何安排时间？学生活动造成的干扰及其影响程度？⑧其他活动：无意愿参加同伴评价及给提前完成评价的学生安排活动。

●材料——①来源：寻常材料还是特殊材料？②获取性：材料是否昂贵？是否可以让参与者自制？③使用：获取频率和难易程度如何？谁酌定获取，是评价者还是被评者，或其他人？④进展：何时和谁推进其他材料的使用以及如何推进？⑤记录：借/拥有材料记录系统是什么？快速有效与否？谁来记录？若材料丢失，谁补充材料？

●培训——①教师培训：对同伴评价相关教育工作者进行培训（包括材料和步骤）；②如何组织参与者培训：分组是一对一还是多人小组？是评价者与被评者分开还是一起培训？培训的日期、时间、地点、次数和时长如何？多媒体设备及其他教具可用与否？材料是直接用还是事先需要预备好？座位如何安排？③参与者内容训练，包括口头简洁指导、书面指导（指导手册、清单、流程图、提示卡）、演示（教师或经验丰富评价者或视频指导）、指导练习和反馈（评价者与被评者直接进行评价或先进行角色扮演）、熟练度考察（包括是否对单个小组进行检查，以及如何确定检查者的数量）、额外训练（对于有需要的参与者，如何确定训练者的数量）、记录（包括报告组织问题、联系、记录等）。

●过程监督——①自我记录：评价者记录还是被评者记录，或都记录？记录频率如何？记录内容是正面还是负面？如何确定记录标准与用词？②同伴讨论：小组讨论还是个人讨论？评价者、被评者是分开的还是一起的？如何确定频率与时长？③是直接观察（需要期望行为或标准核对表）还是需要视频资料反馈？④监督人员指导：包括观察、观察并干预评价者、再次检查；⑤对提前和超时完成参与者的要求；⑥监督教师对同伴评价的信度、效度进行调节；⑦监督频率与时长，同时包括减少活动噪音以及其他的调整和改进措施；⑧适时嘉奖学生并关注作弊情况。

●对同伴评价过程的持续性形成性评价——①同伴评价中和评价后检查评价质量；②一段时间后，调节反馈的信度与效度；③向学生反馈这些信息；④明确被观察和测量的社交、交流技能类型；⑤教师检查学生自我记录和同伴监督下的测试；⑥基于教师课程的测量（由教师发布或评分的概括性任务或小测试）；⑦基于计算机辅助课程的评价（由计算机发布或评分）；⑧外在或内在的奖励。

●对同伴评价的（总结性）评价——①评价目的（无目的的评价是无意义的）；②如何让学生对同伴评价进行评价；③同伴评价运用前后收获如何；④研究设计：确定前后测、基线、对照组；⑤标准测试；⑥标准参照测试；⑦个人或小组测试；⑧态度数据、社交收获、自我报告等数据；⑨短期及长期可追踪数据。

●反馈——①信息整理；②数据分析；③对参与者进行反馈；④来自参与者的反馈；⑤改进同伴评价要素；⑥对评价者/被评者的奖励方式。

同伴评价操作模型可大致分为以上12 个步骤，教师在实施时必须依据具体情境考量每个步骤所对应的问题。例如，一名初中英语教师想就莎士比亚的作文分析进行同伴评价，他在评价前就需获取学校及相关人员的支持、制定同伴评价目的、确定英语作文为评价对象、选择和匹配学生搭档等对同伴评价做进一步的明晰规定（包括任务、反馈、地点、时间等具化活动与时间）及备好所需评价或教学的材料。在评价过程中，教师需对学生进行一轮评价培训，向学生讲解评分标准或提供评价核对表，让学生开展同伴评价并在此期间进行监督与指导，在学生完成评价后，对学生同伴评价质量进行形成性和总结性评价，即在一段时间内追踪学生的同伴评价质量，最后对同伴评价进行总结与反馈。

3. 使用同伴评价操作模型应注意的问题

让无经验的学生作为评价的主人，其评价有效性及质量一直为学生家长、教师及教育工作者们质疑或担忧，为了确保同伴评价操作模型的有效性和实现预期效果，应注意以下问题。

一是社交过程的消极影响被视为影响同伴评价效度的重要因素。任何小组都有可能受到社交过程的消极影响，例如群体参与不足、将别人的成果据为己有、责任分散和互动不积极等。[21]同伴评价可能受同伴关系影响，如亲密友情、敌对关系或其他权力关系、个人受欢迎程度、将批评视为社交无能甚至作弊取得好成绩等，这些影响都会造成同伴评价失效。此外，初次参与同伴评价时，参与者的焦虑感与对同伴负面反馈的在意或排斥也应引起关注。教师首先应告知学生，同伴评价是什么，以及同伴评价可以促进学生学习自主感、个人责任感和学习动机的提升，再设计相关“破冰”活动，增强评价的趣味性、互动性、彼此认同感、自信及与他人的共情能力。在反馈时，教师要让学生先给予积极反馈，这样可减少学生对评价的焦虑和增加其对负面反馈的接受度。[13]

二是学生评价标准明确程度、同伴评价反馈真实程度以及教师对学生同伴评价的训练和监督与否，在较大程度上影响着同伴评价的信度。学生对同伴评价标准的模糊会降低同伴评价的信度，因此，教师应与学生共同讨论、协商并制定评价标准以加深学生的理解及印象，增强学生的主人翁意识。[22]教师要让学生明确反馈形式和性质，以实现同伴评价的目的，此外，同伴评价反馈应在积极反馈后继续提出应改进的部分，这不仅包括指出错误，还包括提出改进方式及给出可行性建议。若没有同伴评价训练、评价标准指导与演示、教师监督和支持，同伴评价的可靠性就不可能高，因此，教师不能略过这些要素及过程。[23]

三、同伴评价的未来展望

1. 聚焦核心素养培育，进一步强调同伴评价的学习功能

虽然同伴评价促进学生学习和作为学习方式这两个功能已被提出，但目前绝大多数关于同伴评价的理论基础或实证研究仍停留在评价阶段，更有甚者将同伴评价作为一种测量方式。仅将评价主体替换成学生，此评分评级方式难逃传统评价方式的窠臼，这种仍聚焦量化结果的评价，在素养导向的学习观下难以测量学生的真实学力，更为遗憾的是，它使得同伴评价“大材小用”。为使同伴评价物尽其用，需强调同伴评价的学习功能，即将同伴评价视为一种学习方式，在开展或研究同伴评价时，围绕学生核心素养培养这一目标，关注学生的学习过程而非结果。

由于同伴评价的开展与研究往往落地于某门学科，同伴评价目标应围绕学科核心素养制定，评价任务设计需与目标一致，只有这样，同伴反馈才能被学生吸收且得到教师的“元反馈”。除了学科核心素养培育，同伴评价的学习功能应表现在关注学生的社会性，既培养学生的沟通表达、合作交流等能力，与之对应的促沟通、促合作的同伴评价参与者匹配模式在未来也将成为研究关注点。而且，同伴评价在一定情况下甚至可成为附属品，用于引发同伴互动和同伴学习过程。[24]此外，同伴评价需要注重更高阶的学习功能，聚焦对高阶思维如评价素养、元认知及批判性思维等的不同程度的培养，进一步将评价与学习进行整合，实现评价目标与学习目标一体化，以评价素养为目标对活动和反馈进行顶层设计。强调同伴评价的学习功能需打破评价与学习之间的理论与实践壁垒，不断深化评价即学习、学习即评价的概念，关注学生学习的过程而非结果，聚焦学生核心素养和高阶素养的发展而非量化分数。

2. 优化操作模型，增加同伴评价的使用情境

随着同伴评价的功能不断被开发和深化，对应的同伴评价操作模型研究也成为许多研究者们关注的焦点。在这些操作模型中，虽然托平最新的操作模型具有普适性，其具体步骤也有一定的指引性，但在特定学科、同伴评价功能及结合先进的信息技术背景等方面，仍有不足。一些学者不断推进特定操作模型的优化与完善，这些优化途径包括更新同伴评价设计要素、重构同伴评价设计原则、优化同伴评价的具体步骤或结构，以及对同伴评价操作模型质量进行评估。

随着评价范式的转型和现代信息技术的发展，上述4 种优化途径也趋于复杂，具有情境特定性，从此，多情境操作模型研究成为推广同伴评价的必经之路。同伴评价设计要素有两种优化途径：一是系统全面考量，对所有要素进行增减和分类，如Adachi 等人基于技术使用和资源支持，将信息技术、学校资源及政策支持纳入设计要素[25]；另一种是聚焦主要设计要素，从评价设计或同伴参与设计两个核心方面进行延展设计。同伴评价的设计原则，可从同伴评价本身功能、基于表现型评价、结合教学设计等多角度进行优化。同伴评价的步骤或结构优化主要针对特定情境，从课堂评价角色、评价与教学关系、具体学科和对应活动等不同角度出发，优化同伴评价操作步骤，例如课堂评价中师生角色两线并行的步骤完善、评价与教学合一式的步骤指令开发、英语写作双螺旋结构上升的操作模型开发及线上同伴评价操作模型步骤等。此外，优化操作模型需对其进行质量评估，Tillema 等人对如何评估同伴评价设计以确保其促进学生学习提出4 个标准，分别为真实性、透明性、公平性和通用性[26]，在开发和优化一系列操作模型后，其对应质量标准也成为研究者们未来关注的重点。

3. 增加实证研究，深化同伴评价的信度和效度

2017 年教育部发布的《中小学综合实践活动课程指导纲要》指明，要鼓励以同伴评价和自我评价等多元评价方式开展综合实践活动。[27]2020 年10 月，中共中央、国务院印发《深化新时代教育评价改革总体方案》，指出“改进结果评价，强化过程评价，探索增值评价，健全综合评价”[28]。同伴评价这种以学生为中心的评价方式正逐渐引起人们关注，然而由于其发展年限较短，人们对其评价功能、学习功能的认识仍不足，对其信度与效度存疑，这些状况造成同伴评价难以在较大范围内推广。而且，随着科技发展，新的同伴评价手段如移动设备的出现，评价应用背景也趋于多样化和复杂化，同伴评价的评价功能和学习功能能否实现还需要持续的证据支持。

在之前的研究中，已有较多的同伴评价信度、效度研究聚焦高等教育层面，而K-12 阶段的同伴评价实践较少，其证据收集并不充足。与大学相比，K-12 阶段学生与家长可能对同伴评价的接受度较低，学生构成、同伴评价组织及实践也出入较大，这需要更多的实践证据加以证明与改进同伴评价的信度与效度，使同伴评价为评价多元化和评价综合化提供支持。除了学段，如何针对不同评价内容实施同伴评价也是未来的研究方向之一。同伴评价虽然被认为具有极强的适应性，但根据具体评价内容，其信度、效度会发生变化。此外，线上同伴评价作为新背景，究竟是会妨害学生学习还是可以作为学习方式被需要，其信度、效度如何变化，怎样的同伴评价新要素和组织能实现网络同伴评价学习效果最大化，这些都需要切实的证据。影响同伴评价信度与效度的个别因素研究也逐渐吸引着研究者们，如参与评分标准与否、教师支持与否、培训与否，等等。

参考文献：

版权归原作者所有，仅供分享之用，如果侵权请留言通知我们删除。

延伸阅读

五破五立：社科成果评价的创新发展

以生为本评价教师解开“五唯”紧箍咒

继续滑动看下一个

人才发展专委会

向上滑动看下一个

观察｜官方通报陕西蒲城一职校学生坠亡：事发前与舍友发生口角和肢体冲突认定该生系高空坠落死亡

桐城一派｜倒在“跨年夜”的龚书记，13个字换来免职调查冤不冤？

比佟丽娅还恋爱脑，怀孕7次流产4次，目睹丈夫背叛却选择原谅

市管干部“龚书记”免职迷局

讣告！又一知名女星在家中去世，终年54岁，曾是无数人白月光…

促进共同发展：同伴评价的历史考察、现实路径与未来方向

您可能也对以下帖子感兴趣

观察｜官方通报陕西蒲城一职校学生坠亡：事发前与舍友发生口角和肢体冲突 认定该生系高空坠落死亡

桐城一派｜倒在“跨年夜”的龚书记，13个字换来免职调查冤不冤？

比佟丽娅还恋爱脑，怀孕7次流产4次，目睹丈夫背叛却选择原谅

市管干部“龚书记”免职迷局

讣告！又一知名女星在家中去世，终年54岁，曾是无数人白月光…

生成图片，分享到微信朋友圈

促进共同发展：同伴评价的历史考察、现实路径与未来方向

您可能也对以下帖子感兴趣

观察｜官方通报陕西蒲城一职校学生坠亡：事发前与舍友发生口角和肢体冲突认定该生系高空坠落死亡