特约稿 ∣ 德国的经典普通教学论模型 —— 有效的抑或不切实际的?
摘 要
在德语国家,普通教学论模型曾被视为理论发展的驱动力[1]。但在当前,教学论模型的重要性在很多情况下并不明显。正如有些关于教师备课的研究成果所证实的,普通教学论模型似乎是不切实际的和抽象的。在此背景下,普通教学论模型似乎不适用于实际的教学。这正是“普通教学论备课模型的开发与评估”项目所研究的问题。该项目旨在将普通教学论作为一门科学应用于教学专业,尤其是针对几个著名的教师备课模式进行分析,例如,柏林模型[2]、汉堡模型[3]、透视模型[4]和折衷模型[5],对这些模型进行评价并使它们更切实可行。本文陈述了迄今为止的在EEPAD项目范围内所进行的三项研究。
关键词
教师教育;教师的专业技能;教师专业化;备课;教学论模型;德国教育理论
作者简介
克劳斯·齐勒/德国奥古斯堡大学教授(奥古斯堡86159)
史戴芬·韦恩克/德国奥尔登堡大学教授(奥尔登堡26129)
约亨·维尔纳/德国奥古斯堡大学讲师(奥古斯堡86159)
译者简介
吕霁月/英国约克大学教育学院硕士研究生(约克YO105DD)
撒兰应/华东师范大学课程与教学研究所硕士研究生(上海200062)
❀ 德国柏林洪堡大学教育学院普通教育系博士研究生彭韬和华东师范大学课程与教学研究所博士研究生林凌为本文提供了精细的校对,谨此致谢。
一、 引言
普通教学论的一个经典定义是作为教学的科学[6],但在当前,这门教学的科学正处在困境之中。近年来,作为培训科目和教学专业化的科学[7][8],普通教学论受到了人们的密切关注。在德国,它的前景被认为是暗淡的,甚至被描述为过时的或“僵死的”[9][10]并进行了“再生的尝试”[11]。诸多此类的反思可谓是对普通教学论的“重新定义”,经验性的教学和学习研究等学科被认为是普通教学论的“接替者”[12]。
普通教学论的备课模型作为普通教学论实质上的核心[13],也饱受争议。这些模型在1960—1990年间曾被视为普通教学理论的发展动力[14],但在当前,人们根据托马斯·S·库恩的理论[15],这些模型通常被看作是科学的“死胡同”。克罗恩(Kron, F. W.)归纳出了40多种教学论模型,并阐释了范式的终结[16]。
理论家呼吁更多地关注实证研究方法。特别是教学和学习研究作为一种模型发挥作用,但也涉及诸如教师的教育教学知识等领域的研究[17][18][19][20]。事实上,这些理论提供了许多联系点,正如李·舒尔曼(Lee Schulman)在“一般教学知识”、“学科相关知识”、“教学内容知识”和“课程知识”之间进行区分时所注意到的[21],以及鲍玛特和昆特(Baumert & Kunter)在此基础上对这种类型学的进一步发展[22]。无独有偶,哈蒂(Hattie, J.)的大规模研究也明确强调教师的备课行动是教学成功的关键[23]。
但是,普通教学论模型被批评为是不切实际的、与实践无关的[24][25][26],而一系列有关教学计划的研究似乎证实了这种批评。学科教学论和教与学的经验研究都发现,教和学总是需要和一个主题相联系[27],因此普通教学论模型对此无甚助益。
“普通教学论备课模型的开发与评估”项目(Entwicklung und Evaluation von Planungsmodellen der Allgemeinen Didaktik,简称EEPAD)所面对的正是普通教学论的这种困境。本文介绍的是迄今为止在该项目范围内进行的三项研究。第一项是一个定性的初步研究,旨在形成针对备课模型的评价范畴。第二项是为了使初步研究的结果能被量化而开发问卷调查工具的试点研究。前两项研究的结果将简要地进行呈现,第三项研究则将进行详细描述。在这项主研究中,师范生、实习教师和教师被要求对各种各样的普通教学论的备课模型做出评价,旨在寻找经验证据来解决这个问题: 普通教学论模型实用吗?
二、 研究状况
(一) 已有研究成果
学校教学是制度化、专业化和高度大规模体系化的[28][29]。因此,在教师教育和教师专业化的研究中,备课活动已显然成为一个热门话题,因为它在教学过程中占有重要地位。为此,像教学论模型所尝试的那样对教学进行的建模,是必不可少的,一则因为这种建模因其直观性、简化性和实用性等特征而有助于对复杂事物进行结构化并降低复杂程度[30],二是教学的模型既基于理论同时又能直接指导行动。就此而言,对教学的建模在理论和实践之间架设了一座重要桥梁——即使不是唯一的那座桥梁[31]。
正如在上文“引言”中所提到的,克罗恩统计出了四十余种不同的教学论模型。近半个世纪中理论家们虽然不断地开发“新”模型,却并未真正提供任何“新”内容,而且也没有考虑如何经验性地对它们加以证实——直到今天,这一切都未得到改变。
在80年代以前,几乎没有任何有关教师备课活动的实证研究发现,因为研究者们的研究兴趣主要集中于教师在教学过程中的活动。直到认知转向,备课中所涉及的思维过程才开始在教学研究中得到更多的关注。关于该话题,德国和国际上的研究者已采取了不同的方法来进行讨论(相关概览详见Haas)[32]。包括问卷调查(例如,Zahorik)[33]、案例研究(例如,Toomey)[34]、观察(例如,Yinger)[35]、访谈(例如,Clark & Elmore)[36]、有声思维法研究(例如,Bromme)[37]、对教学方案(Unterrichtsplanungen)的文本分析[38]、基于视频的刺激回忆访谈(例如,Mischke & Wragge-Lange)[39]以及用虚构的内容或对学生进行的实验室研究[40]和在真实教学环境中所进行的实验研究。然而,这些研究中的大部分都依赖于对具体的备课活动的记录,其中的一些数据甚至采集于教师的家中[41][42]。
这些研究的结果因各自所采用的方法和侧重点不同而不同。但我们还是可以从中观察到共同的趋势: 美国的大多数研究都在调查通过理论开发的阶段模型是否能切实地用于实践中。主要的关注点在于学习目标在备课过程中的地位和作用。研究表明,这些理论模型(例如:Hawthorne; Morine; Morine-Dershimer; Peterson et al.; Zahorik)所规定的备课步骤的顺序并没有可用以支撑的实证的证据[43][44][45][46][47]。恰恰相反,这些研究所涉及的教师是在对(与学科相关的)内容进行思考的过程中开始备课活动的。
德语国家对教师的备课活动的研究很少。布罗姆的研究可能是德国研究中最常被引用的,他用有声思维法来研究数学教师日常如何备课[48]。哈斯(Haas)[49]和特布吕格(Tebrügge)[50]选用了类似的方法,后者还将有声思维法的研究和书面调查与访谈相结合。还值得一提的是温格特(Wengert)[51]、萨格德(Sageder)[52]和塞弗里德(Seifried)[53]等人的问卷调查。总的来说,德国的研究总的来说得出的是这样一个结论,即教师在备课时并不遵循教学论模型。哈斯总结说,“教学论被描述得过于理论化、过于抽象、过于晦涩、过于深奥,而且不可能在日常实践中得到实施”[54]。忒尔哈特(Terhart)和克利伯特(Klippert)都证明这种观点也适用于教育学话语。忒尔哈特认为,“恶意的言论会声称”,普通教学论模型“仅仅是师范教育的‘考试内容’。……例如,有关教师的备课和教学活动的研究表明,对经验丰富的教师而言,普通教学论的纲领几乎不起任何作用”[55]。克利伯特甚至用了一整节的篇幅来讲述普通教学论的不切实际性,他在其中指出:“这一代教师都是受了普通教学论的影响而成长起来的……但普通教学论对教师的教学专业化并没有提供过多的帮助”[56]。因此,大多数作者都认为教学论模型与教师的日常教学并无多少关系,这些模型并无实际效用。
(二) 对已有研究及其结论的评价
对上述结论我们应以批判的眼光来看待,原因如下: 首先,该结论断言这些模型在教师的备课活动中不起作用。无可否认,没有哪个模型是丝毫不差地得到实施的,但任何一位模型的开发者都不会要求做到这一点。此外,如果仔细研究这些研究结论,我们可以看到教学论模型的各方面都在教师的备课中有很好的体现。例如,布罗姆总结说,虽然教师是根据教学过程来制定他们的教学计划的,但“他们在执行课程决定之前也会考虑海曼奥托舒尔茨模型所描述的其他情况”[57]。哈斯得出的结论是:“教师必须遵守教学标准,但教学设计过程并不能反映出普通教学论的模型”[58]。有研究者认为,教师的教学工作不只是复制,而是以折衷的方式进行[59]。
其次,这些研究者所得出的结论是基于这样一种基本假设,即所有参与研究的教师都(通过教师培训而)熟悉普通教学论模型。但是,根据奥尔登堡大学教学论中心(Didaktisches Zentrum)针对500多名学生所进行的一项调查所显示的,实际情况并非如此。在这项调查中,大约三分之二的参与者都表示他们并不熟悉教学论模型[60]。因此,在明确那些参与调查的教师是否熟悉普通教学论模型之前,我们并不能在模型的实际应用和实用性方面得出结论。
最后,这些研究并未直接针对教学论模型及其实用性,它们所针对的是教师的一般性的教学设计活动。因此,有关这些模型的结论并不是直接的有针对性的研究结论,而应当更多地被看作是研究的副产品或解释。
针对普通教学论模型的研究应当以质性研究为导向或至少应从质性设计开始,这样才合理可信。尤其是封闭式问卷只在一定程度上适用于研究教师根据教学论模型所做的个人的教学设计活动和他们对教学论模型的定位,特别是当这种问卷——像上述研究那样——都不是专为此问题而设计的时。虽然这些研究中的大多数都是质性导向的,但它们在以下方面仍然存在缺陷: 其一,它们限于过小的样本量,在某些情况下甚至只是个案。例如,英格尔(Yinger)的教师研究样本数为1[61],考赫普里维(Koch-Priewe)的研究样本量为4[62],布罗姆研究样本量为14[63],哈斯研究样本量分别为10[64]和12[65],而温格特(Wengert)的研究样本量为34[66]。其二,它们仅限于个别科目和特定年级。德国的大多数研究聚焦于数学课,例如布罗姆[67][68],哈斯[69][70]和温格特[71]。英美的研究则聚焦于小学教师,例如英格尔[72]和莫里黛西莫(Morine-Dershimer)[73]。只有少数的研究进行了研究信度的检验,因而要得出一般性的研究结论就变得很困难。
“近期”的大量研究[74]非常重视日常的教学设计活动,例如日程规划、经验和专家知识。因此,他们在尽可能真实和熟悉的情况下来测评教师的教学设计。虽然这一程序在效度上是有意义的,但在其他方面却应受到批评。例如,在研究“教学论模型是否在教师备课行动中有所体现”这个问题时,研究所选的设计并不符合研究目的: 如果研究专家的日常教学工作,那么教学论模型的单个方面和单个组成部分从一开始就当然地不会有体现。经验丰富的教师不会在对每节课做出安排设计的时候都开展一遍“条件分析”[75],或者是研究他最熟悉的班的人类起源学的前提条件[76]。由于他们的专家知识,他们不再(需要)做出明确的教学方面的考虑。例如,一个使用过多种教学方法的教师,其长年的经验已经使之不需要再考虑为一堂课进行方法上的设计,因为他们不假思索地就知道这个问题的答案了。教学的内容和主题也是如此,因为它们已经被教育标准、课程或学校的教学计划所规定。例如当教师面对较不熟悉的学习群体时,许多设计步骤就只与既定的课程和教学设计活动相关。
针对专家型教师的教学设计活动的研究所遇到的另一个障碍是,经验丰富的教师早已开发出了他们自己的设计路径。因此,他们的设计活动至少有部分是自动化的,这意味着他们不再有意识地考虑个人的设计步骤,也不会在自己报告(例如,访谈或出声思维)中有所提及。通过这种方式是不可能获得隐性知识的。相反,我们有必要使用一种将这些设计活动带回意识层面的研究设计,从而使隐性知识变得清晰可知。记录教师日常教学设计活动并不是一种合适的方法——除非研究对象是那些刚刚参加过专业化培训的教师。
三、 存在的问题
以往对教师的教学计划的研究从未明确地聚焦于对教学论的备课模型及其实用性的检测。尽管如此,研究者们还是从本质上总结出了教学论的备课模型的以下要点: 第一,教学论模型对于教师的备课活动并无作用;第二,教学论模型是纯粹的学术性建构,在日常教学实践中无用。
如果仔细观察这些研究,我们可以就它们的方法和内容做出批评,从而使这些研究结论的有效性受到限制。总言之,基于这些批评,我们不应将已有的研究成果看作是有科学根据的观点,而更应当将它们看作是研究结论和解释[77]。如果我们想要确定教学论模型的实用性,那么,针对教师的教学计划所开展的研究并不能取代直接针对教学论模型的研究。
就此而言,对教学论模型的实证检验是一个需要解决的研究课题。这正是下述“普通教学论备课模型的开发与评估”项目的研究目标。
四、 第一项研究: 普通教学论备课模型的质性研究
普通教学论是一门教师专业的科学,也是一门教师培训的学科,“普通教学论备课模型的开发与评估”项目的框架就是普通教学论的实用性问题,它尤其旨在以实证为基础来分析和评估普通教学论备课模式,以便对它们做出改进,进一步提高它们的实用性。该项目的出发点是上文所述的研究之不足,即普通教学论的备课模型从来没有得到直接的实证评估,尤其是其实用性的方面。此项目中所进行的三项研究将在下面的部分中进行描述。
下面所描述的定性研究主要是关于教学模式的实用性。在调查研究的基础上,通过分析采集的数据,对该研究的实用性进行了深入的了解。
(一) 目标
第一项研究的主要目的是评估普通教学论模型的实用性,以及它们在教师的备课活动中的可实施性。这涉及到要对教学论模型的实用性的标准进行分类,并基于这些类别对教师所熟悉的备课模型进行检测。
(二) 方法和抽样
这项研究借助于书面问卷的方式进行。我们调查了62位师范生,要求他们借助于不同的备课模型尝试在头脑中设计具体的一节课,然后要求他们描述他们是否喜欢他们所采用教学论模型(“这个备课模型中的什么部分你喜欢/不喜欢?”)他们可以采用开放题的回答方式写下积极的和消极的方面,内容上不受限制。为完成这项任务,项目要求他们必须运用学习理论的教学论(海曼)、教授理论的教学论(舒尔茨)和批判建构的教学论(克拉夫基),教学论模型的原图都印在问卷上(柏林模型,汉堡模型和透视模型)。对这些普通教学论模型的选择是根据导论性书籍和教科书中所阐述的核心意义而进行的[78]。我们通过内容分析法[79]来分析参与者所做出的回答,并从中归纳性地推导出类别。为此,我们首先根据其内容将每个语句分配给一个类别,然后将其编码为是正面的或负面的描述。为了达到可靠的质量标准,我们在两名编码人员的帮助下,对编码器的信度做了相应的测试(霍尔斯蒂)[80]。
(三) 结果
概而言之,受试的660个评语评价了本研究重点观察的上述三种教学论模型,其中,有335个是正面的评语,另325个是负面的评语。然后,我们在归纳过程中建立了一个分类系统。这使我们能够将这些语句归在24个子类下,每个子类又分属于以下四个父类: 呈现(presentation)(例如,“模型令人感到困惑”)、内容(content)(例如,“我喜欢的是,该模型同时考虑到了学校以外的情况”),可理解性(comprehensibility)(例如,“许多缩写使模型变得难以理解”)和实用相关性(practical relevance)(例如,“这个模型无法帮我设计一节课”)。信度测试结果很不错,CR=.93。
对普通教学论模型的有效性所做的评价表明,我们找到的这四个范畴能够描述教学论模型的实用性。关于对进一步的细节和模型内容的评估,我们建议读者参阅齐勒和韦尼克(Zierer & Wernke)[81]的研究。以下部分只涉及派生的类别。
五、 第二项研究: 针对普通教学论模型之实用性的问卷开发
第二项研究是一项旨在开发可用以评估教学论模型之实用性的问卷试点研究,它直接以第一项研究的结果为基础。
(一) 目标
该试点研究的目的是开发一种有信度的测量工具,以一种封闭式问卷的方式对备课模型的实用性进行差异化评估。经第一项研究后发现,教学论模型的实用性可以根据经归纳所获得的范畴来确定,这项研究一方面应继续开展进一步的测试,另一方面应进行量化。
(二) 方法和抽样
我们使用已有的研究结果开发一个封闭式的调查问卷。问卷的题目设计与之前从定性分析中得出的24个子类相对应。根据研究1,四个父类为: 呈现、内容、可理解性和用以确定实用性的实用相关性。
如同上一个研究那样,受试被要求借助于一个教学论模型在心里设计一节课,然后对模型做出评价。由于这是对问卷的预测试,我们最初只是基于其中一个模型(克拉夫基的透视模型)来进行试测,并采用里克特量表来进行评价,从“(1) 强烈的不同意”到“(5) 强烈的同意”。量表的构成和题目的精确措辞可以从因子分析中获得结果(参考表1)。
来自奥尔登堡大学的98名师范生参加了这项调查。该调查是以在线问卷的形式进行的。为了验证问卷设计的效度,我们进行了验证性和探索性因子分析。附加的探索性因子分析旨在验证测试研究1中定性地获得的父类范畴是否在无限定性假设的情况下在探索性因子分析中也找得到。为了测试问卷的信度,我们根据克龙巴赫的阿尔法公式计算内部一致性数值。
(三) 结果
验证性因子分析结果(参考图1)表明,除了I1、I6、I8和I9等题目之外,其它题目都可以被分配到四个分量表中。根据巴克豪斯等人(Backhaus, Erichson, Plinke & Weibe)的研究结果[82],模型的拟合值处位于可接受的范围内: CMIN/DF≤2.5,CFI ≥.90,和SRMR≤.08。在分析的基础上,D1D5等题目构成“呈现”分量表,I2I5和I7等题目构成“内容”分量表,V1V7等题目构成“可理解性”分量表,P1P3等题目则构成“实用相关性”分量表。I1、I6、I8和I9等题目则不再纳入进一步的考虑。
图1验证性因子分析的结果
最大似然法(标准解);χ2=327.533,df=164,p<.001,CMI/DF=1,99,CFI=.90,SRMR=.069,所有加载系数p<.001
对于探索性因素分析,我们确定了4个值>1(凯撒标准)的因子。参看陡坡图可以进一步强化四个因子的解决方案。仔细研究各个因素内各个题目的加载系数,也可以排除掉I1、I6、I8和I9等题目(参考表1)。
相应信度的计算获得了很好的量表内在一致性结果,克龙巴赫α≥.87(参考表1)。总的说来,为该研究设计的调查问卷通过了试测阶段,因此它可用于测量后续更大的样本量。
六、 第三项研究: 普通教学论备课模型的评价研究
第三项研究是本文所述的项目研究中的重点。在初步研究和试点研究中设计和测试使用过的问卷,依然适用于在后期更大的样本情况,并且现在对其内容进行了分析。
(一) 目标与假设
第三项研究的目的是对普通教学论模型的实用性做出详细评价。除了对几种教学论模型进行基本的评价外,这项研究还旨在鉴别出个别模型的具体的优势和劣势,并揭示不同受访者对模型的实用性所持的不同态度。根据定性的初步研究的结果[83],我们假设受试将更积极地评价所有模型的分量表的内容,看到作为整体的模型的可理解性需要得到改进;我们预计这些模式之间的差异主要会出现于对其表述方式和实用相关性的评价上。
此外,我们还对专家型教师和新手教师所做的实用性评价做了对比,以探究教学论模型是否有一个“更适合的”目标群体。以往关于这一主题的研究(参见上文第2部分)只针对已具备专业经验的教师。但是,我们仍旧需要思考: 比起有经验的教师,新手教师是否会更多地从这些教学论模型中受益?由此,相应的研究假设是: 教师的经验越多,他们对普通教学论模型的评价就越消极。因为教师的经验越丰富,就越会带着批判的眼光看问题,并减少他对作为定向辅助手段的模型的依赖程度。
(二) 方法与抽样
第三项研究使用了之前为试点研究所编制的问卷。根据因素分析,该问卷包括20个题目,分属四个分量表,即呈现、内容、可理解性和实用相关性。
与第二项研究不同的是,受访者不再只是评价其中一个备课模型,而需要对四种不同的备课模型做出评价。前三种模型,即学习理论的教学论模型(海曼)、教授理论的教学论模型(舒尔茨)和批判的建构的教学论模型(克拉夫基),在问卷上都附有原版图示(柏林模型、汉堡模型和透视模型)。从学术史的角度看,选择这些教学论模型是合理的,因为这三种教学论模型享有“经典模型”的特殊地位[84][85]。第四个模型我们选择了齐勒的“折衷模型”[86]及其原版图示。正如“折衷”一词所暗示的那样[87],这个模型体现了选择和结合来自德语和英语世界的各种教学论模型的最新尝试。在这个意义上,折衷模型所追求的是,在多样性中寻求统一,以扬长避短[88]。
这项调查同时采用了在线问卷和纸质版问卷,被调查者可自由选择。调查对象共351人,其中,师范生188人,实习教师66人,来自各类学校的教师97人(参见表2)。
表2样本描述
为了进行数据分析,我们首先报告描述性的结果,来在各分量表上呈现对每个模型的评价。为了进一步比较模型评价的防护四,我们对配对样本做了t检验。为了比较师范生、实习教师和教师的反应,我们借助Scheff检验计算单因素方差分析和随后的临时分析(post-hoc analyses)。第二步将解释这些结果。
(三) 结果
1. 信度
我们分别计算了每个模型的量表的信度。表3概述了子量表内部一致性的检测结果。如表所示,信度值最低为α=.74,无一例外地可被看作非常好的测试结果。
表3子分量表的效度测试结果
N=351;柏林模型n=350;汉堡模型n=330;透视模型n=316;折衷模型n=314,以Cronbachs alpha公式测试量表的内部一致性
2. 描述性结果
本研究基于五点量表上的四个实用性分量表对这些模型进行了评价。因此,基于结果中的算术平均值,值>3的可被解释为是积极的评价。下面,我们分别介绍了四种教学论模型的描述性结果,并对它们进行了比较和总结。表4对所有模型的平均值进行了初步(纯描述性的)呈现。
表4描述性统计: 各模型的平均值和标准偏差概览
注: 总数N=351;柏林模型n=350;汉堡模型n=330;透视模型n=316;折衷模型n=314
柏林模型在所有分量表的平均值>3。因此,总体上对它的评价是肯定的。“呈现”分量表达到了最高平均值M=3.53,其次是“可理解性”的平均值M=3.40。这些方面显然是该模型的优势所在。分量表中的“内容”平均值(M=3.24)和“实用相关性”平均值(M=3.07)略高于标准值(M=3)。因此,柏林模型被认为是可理解的、呈现得很好、内容一致的,但模型的“实用相关性”的评估则较为中立。因此,柏林模型中受访者认为有改进空间的方面就是该模型向实践的转化。
无论是与其它模型的整体比较还是在每个分量表中的比较,汉堡模型都是最低的平均值。它是唯一一个平均值<3的模型,因此受到了负面的评论。该模型在“呈现”上得到的分值最低(M=2.34),“可理解性”(M=2.70)和“实用相关性”(M=2.59)也只能得到与负面评价相对应的平均值。因此,汉堡模型被认为是不可理解的,没有很好的进行呈现,也没有以实践为导向。只有在“内容”分量表上的平均值M=3.08,模型才获得一些较正面的评价,因此它在内容上没什么可批评的。从整体上看,这是唯一可被描述为不切实际的模型。
在所有模型中,透视模型获得了第二高的总体评价。在分量表“可理解性”(M=3.67)和“内容”(M=3.77)上它尤其受到了被调查者的正面评价。因此,克拉夫基的透视模型在内容上被认为是易于理解和令人信服的。“实用相关性”的得分(M=3.49)也证实了它的实用性。只有在“呈现”方面,其平均值才略低一些,这个分量表的分值M=3.26体现出其最弱的一个方面。
在本研究中,折衷模型获得了最高的评价。所有量表的平均值都>3.5。因此,它在每个量表上都获得了正面评价。被调查者对该模型的“呈现”给出了最高评价(M=3.89),其次是“可理解性”(M=3.75)、“实用相关性”(M=3.71)和“内容”(M=3.59)。高平均值结果表明,该备课模型是切实可行的。
因此,在四个模型的比较中,折衷模型在总体上获得了最高评价: 它在三个分量表(呈现、可理解性和实用相关性)上获得了最积极的评价。其次是视角模式,它在分量表“内容”上获得了最高的值,在其它分量表上也取得了很好的测试值。柏林模型的评价并不显著,因为平均值既不高也不低。但总的来说,它们都处在正面评价的范围内。汉堡模型跟其它模式比起来平均值最低,其中三个分量表(呈现、可理解性和实用相关性)得到的是消极的评价,仅在分量表“内容”上得到了满意的评价。图2提供了四个模型的平均值的比较。
图2四种模型的量表的平均值比较
由于被调查者分别对四种模型进行了评分,因此可以对配对样本做t检验,以与受访者对单个模型的评分(呈现、内容、可理解性和实用相关性)进行比较。这些分析清楚地表明,所有的评价(只有一个例外)在1%的水平上有显著差异。我们可以举例说明,折衷模型在分量表“呈现”上的评分明显优于柏林模式(t=6.12;df=313;p≤.01)、汉堡模型(t=23.54;df=312;p≤.01)和透视模型(t=9.06;df=312;p≤.01)。唯一的例外是,与折衷模型相比,透视模型的“可理解性”的ratings(t=1.49;df=312;p=.14),在配对样本的t检验中,这里发现的差异并不显著。
(四) 平均值比较: 师范生—实习教师—教师
通过对师范生、实习教师和教师的均值的比较显示,个别的小组倾向于进行类似的评价: 其中一组评分为正面的模型也被其它组评为正面的。如果按等级表排列,那么所有受访者组的模型评价都是可比较的。这并不能看出对不同模型的偏好。但总的说来,从师范生到实习教师再到教师,评价结果呈明显的下降趋势(参见表5)。
表5四组试验对象的模型评价结果
如果用薛费法检验用post-hoc分析计算单因素方差分析,那么,在17个(共48个)案例中清楚地显示出各组之间的显著差异(见表5)。在这些案例中,其中9例是学生和教师之间的差异,其中8例是学生和实习教师之间的差异。相比之下,实习教师和教师之间无显着差异。
在柏林模式中,师范生和教师的评价在“内容”和“实用相关性”方面存在显著差异。在汉堡模型中,与实习教师和教师在“内容”、“可理解性”和“实用相关性”方面的评价相比,师范生的评价也呈现出显著差异。通过对透视模型的评价发现,师范生和实习教师在“内容”和“可理解性”两方面存在显著差异。最后,在折衷模型中,师范生的评价在“呈现”、“可理解性”和“实用性”方面与实习教师和教师的评价存在显著差异。在“内容”量表上,只有师范生和教师的评价不同。
师范生评价和其它任何一组测试对象在量表上的差异,仅在“呈现”这一分量表上有着显著差异,但这种差异存在于五个案例中的每一个分量表上,即“内容”、“可理解性”和“实用相关性”。因此,与其它量表不同的是,对模型的“呈现”的评估似乎根本不取决于其专业程度。
最后,值得注意的是,柏林模型的“实用相关性”量表和汉堡模型的“内容”量表上,师范生的评价和至少一组其他受试的评价不仅存在显著差异,而且其各项平均值也都低于样本总体的标准算术平均值M=3。因此,柏林模型在分量表“实用相关性”上得到了教师的负面评价;汉堡模型在分量表“内容”方面也未从实习教师和教师那里获得令人满意的评价,从而在全部四个实用性分量表上都受到了他们的负面评价。
七、 讨论
在EEPAD项目的框架内,我们开展了首次直接针对德语国家备课模型的基于实证检验的研究。这些结果与最近的出版物中的主流观点相矛盾。在最近的出版物中,有研究者提出,教学论模型是纯粹的学术性建构,并无实用性。
(一) 研究结果概览
为了评价备课模型的实用性,我们首先进行了定性研究,以确定实用性的理论建构包括哪些方面。我们用师范生的描述开发了一个范畴系统,用来说明备课模型的实用性。由此形成的系统包括以下范畴: 呈现、内容、可理解性和实用相关性。
在此基础上,我们在定量试点研究中制定了问卷。理论分量表得到了证实,问卷也被证明是评价备课模型的实用性的一种适用的测量工具。
在主研究中,我们采用了问卷调查的方法,从师范生、实习教师和教师那里收集了他们对四种教学论模型所做出的评价。评价结果表明,柏林模型、透视模型和折衷模型在总体上是具有实用性的。只有汉堡模型在几个分量表上得到了<3的平均值,因此被认为是不切实际的。据此可以确定,在经验上并未证实诸教学论模型都不实用。
此外,测量实用性的分量表可用来建立每一种模型的“轮廓”,以显示其优势和弱点: 柏林模型在“呈现”上有其长处,在“实用相关性”方面也有其弱点。汉堡模型仅有“内容”方面是令人满意的。透视模型的显著优势却是“内容”,而且在模型比较中达到了最高值。折衷模型在各方面都显示出很好的效果,在“呈现”、“可理解性”和“实用相关性”等方面都达到了最高分。
(二) 教师、实习教师和师范生评价的差异
通过对教师、实习教师和师范生的评价进行对比可知,对模型实用性的评价有趋同的倾向。一个重要的发现是,评价取决于实践经验: 实习教师和教师对模型的看法比学生的更有批判性。因此,在这一点上我们能够证实我们的假设。
这一发现的一种可能的解释是,因为缺乏实践经验,这些模型为师范生提供了他们在设计一堂课时仍然需要导向性的辅助手段。进一步的研究表明,教学论模型的使用效果与学校实习对师范生备课能力的影响非常相似[89][90]。教师(也包括实习教师)因其教学经验而较少需要这类模型的导向。当他们设计一堂课时或者甚至是在自动进行这一过程时,他们明确知道要注意什么: 虽然他们有“自己的”实用模型,但仍然可以回溯到普通教学论模型。
同样令人惊讶的是,在对所有模型的评价中,师范生的评价与其他任何一个小组的评价之间存在显著差异。在分量表“可理解性”和“实用相关性”上,三种模型都是如此,而在分量表“呈现”上,只有折衷模型表现出显著差异。因此,不同的分量表似乎受到了参与调查者实际经历不同程度的影响。关于“内容”的评价变化最大,而在“呈现”上的评价几乎没有变化。在这一点上,我们也有理由推测,学生可能会因为缺乏经验知识而对内容做出不同的评价。然而,实习教师和教师对这些模型的内容(汉堡模型除外)的评价的平均值>3,这表明教学论模型的内容与教学实践相关。
在对测试对象组的比较中,随着实践经验的增加,对模型的可理解性和实用性的评价也越来越低。唯一一个看似不受经验影响、但在所有小组中保持相对稳定的分量是“呈现”。不过,对呈现方式的评估似乎是由一般标准决定的。
同样突出的是,实习教师的评价和教师的评价并没有显著差异。这一发现表明,一旦教师获得了一定程度的经验知识,实践经验的时长就不那么重要了。但有必要进行更详细的研究,以确定教师是在什么时候真正达到了这一点。
总之,这些结果与许多出版物中所声称的教学论模型不切实际的论断相矛盾。同时,这些结果也为下面这种普遍观点的起源提供了线索: 随着经验的增加,评价变得更加消极,因为教师在获得经验时形成了他们自己的主观模型。如果有人问教师,普通教学论模型对他们个人的课程设计有什么意义,答案就会是否定的,因为教师们看到这些模型时,通常与考试要求联系在一起,或是只在他们实习时期记下来的具体课程计划中才会想到这些模型。
(三) 展望与影响
到目前为止,普通的备课模型一直被认为是纯学术性的和不切实际的建构。但根据本研究所描述的研究结果现可得出以下结论: 德国的教学模型——除汉堡模型外——在实用性的各分量表上得出的评价都是积极的。这项评价从师范生到教师呈下降趋势,但对所有群体而言,评价都是积极的。实习教师从模型中获益最多,因此这些模型应该在教师培训项目中发挥重要作用。
特定群体之间表现出来差异提出了这样一个问题: 对经验丰富的教师而言,是否存在更有效用的模型?鉴于现有的模型从一个中立的观点描述了课程的潜在要素和推荐的备课步骤,“专家模型”可以包括教学质量: 好的教学的要素是什么?在规划和实施教学时应该注意什么?侧重点各不相同的模型如何帮助有经验的教师提高他们的上课质量?一种可能是参照哈蒂[91]和赫尔姆克(Helmke)[92]的研究并将他们与教学模型结合起来。
折衷模型在与各模型的比较中得到了总体上最好的评价。根据齐勒的观点[93][94],这种模型可看作是一种综合模型,它是基于对肯·威尔伯(Ken Wilber)的观点[95]的反思。威尔伯认为,在每一种真正的“理论”和与其相竞争的“理论”之间有可能找到一个共同点。鉴于此,折衷模型具备了其它模型的核心元素,从而克服了建立教学论模型的不可控的分离和增值(参见库恩)[96],提供了一种“普遍的导向”[97]。由于该模型的良好结果加强了这一导向,因此应进一步推行这一方法,并进一步完善该模型。本文提供研究结果从师范生、实习教师和教师的角度说明了这一点是必要的。
最后,我们还要对我们自己的研究程序进行评判性的反思。与其他所有研究一样,这里所描述的研究方法也有局限性: 例如,侧重于考察备课模型的实际运用,而忽视了对教学本身的分析。此外,对教学理论的测试将模型降低为了对它们的图示,这可能会导致理论深度的降低。这是普通教学论模型一般讨论问题: 大学生,实习教师、教师甚至大学讲师所了解的普通教学论模型往往来自于一般参考文献的简明陈述,很少有人详细阅读海曼、舒尔茨、克拉夫基等人的原著。最后还应该提到的是,本文所叙述的研究并未在实际运用中检验这些模型。受试者被要求在头脑中设计一节课。因此,对设计过程的考察——包括一系列对设计方案和教学评价的跟踪调查,以之能够对备课质量和教学质量做出客观的评价——仍然缺乏。这也适用于对学科相关的教学论模型的评价。这些问题将在后续的EEPAD项目中得到研究。因此,这些研究不应被视为教学设计研究的一个终点。相反,这里得到的结果为这一研究主题开辟了新途径。
参考文献
《全球教育展望》投稿网址
http://www.kcs.ecnu.edu.cn/globaledu
扫码关注最新动态