科学传播中的衰减效应
点击蓝字,轻松关注
在科学界一直存在这样一种现象:在某个领域的一系列研究中,最开始的一两个研究总是有着非常显著的结果或者非常大的效应量;但是,随着学者们在这个领域研究地深入,这些显著的结果或者大的效应量会逐渐缩小甚至消失。这种现象被称之为科学的衰减效应(Decline effect)。关于这个现象最早的例子是20世纪30年代超心理学研究(译者注:用科学方法研究各种超能力心理现象的领域)中的超感知觉现象研究(Extrasensory perception,ESP,比如心电感应,预知等)。心理学家J.B.Rhine最早通过纸牌预测实验测试了一些所谓的超能力者(译者注:实验道具为带有图形的扑克牌,每副牌5张,每张均有一个简单的几何图形,图形分别为十字、星号、三道波纹、圆圈和方块。实验时用5副纸牌,共25张。实验过程中在被试看不到纸牌的情况下请他猜出纸牌上的图形。如果猜牌正确率高于随机猜测的概率,则可认为是ESP存在的证据)。在最开始的几个研究中,一些超能力者表现出了非常高的预测水平,但是随着后续实验的重复研究,他们的预测水平逐渐下降,最终回到随机猜测的水平。在现在的科学界,研究者在整个生物医药、心理学与神经科学领域甚至整个泛行为科学领域(管理学,教育学,传播学)都发现了这个现象。
衰减效应的原因
衰减效应出现的首要原因是:某些领域的基础科研人员,特别是那些整日被要求尽快做实验和发文章的研究者,其中很多人会“折磨”数据直到找到一个显著的结果,而很少进行重复性的实验去验证某个新领域的新效应。这导致了他们很难得出非常严谨的结果。随后他们会把这个显著的结果发表,而那些对他们来说“负面的东西”(如不显著的结果,折磨数据的过程等)自然不会在文章中提及,这也就是所谓的“抽屉效应”。另一方面来看,学术杂志、编辑们和其他科学工作者甚至公众们都只会对显著的结果感兴趣。而这一系列过程的最终成果就是:哇!又有一个新的发现诞生了!
这种结果会让人觉得耳目一新但又从第一直觉上感到怀疑,并且,这样的文章还很有可能会在一个相对知名的高影响因子的杂志发表。因为他们(这些杂志)成功的秘诀就是,将一些新的、充满争议的发现在科学共同体或者公众中传播,从而获得影响力。
一些学者可能会看这个论文并且顺着它的思路继续进行研究。当然,大多数人不会得到什么成功的结果。这个时候,他们一般会反思:可能是我的研究哪里做错了,之后毫不犹豫地把这个“失败的结果”扔进垃圾桶。就算少部分非常固执的人坚信一定是最开始的研究出现了问题,为了证明这点,他们必须多次进行重复实验,尝试多次后才能发表这种负面的结果。从各种意义上来说,这都会比最开始那些发表显著结果的人要困难得多。比如,他们必须接受杂志请来的专家们一次又一次地审核,甚至可能被要求做更多的重复实验。还有可能,即使原研究的团队成员不是审稿人,这些审稿人也很有可能是原始研究团队的朋友、熟人、同事等(因为科学论文的同行评审需要是这个领域的专家)。这些过程都需要大量的时间,而在这一段时间内公众很有可能早已对最初的研究结果深信不疑了。
科学中“神话”的建立
在科学传播的辅助下,最初“显著的”成果可能已经在公众的意识中生根发芽。比如“选择性5-羟色胺再摄取抑制剂能有效治疗抑郁症”曾被认为是科学、有效的。但10多年后,一系列研究成果证明,这种方法是没有什么效果的。但是在这10多年间,这种科学中“神话”已经被建立起来了。另一个例子是关于注意缺陷多动障碍(ADHD)的:在很长一段时间内ADHD被广泛地被认为是一种大脑基底核中的多巴胺转运蛋白的问题而引发的大脑病变。显然这只是神经药理学上的一种解释,之后的研究完全推翻了最开始的结果。
从上述的例子中我们发现,对科学研究方法的仔细思考是十分重要的。并且,也要重视一个研究的发表在整个科研过程中的位置。对于一个研究而言,新发现是否是最重要的?当一个研究显示出这点时,读者可要倍加小心。这个研究是否有被重复过的研究结果?只有当这点满足时,读者们才有必要去看它的效应量。是否重复的效应量大于(译者注:或者等于)原始的效应量?只有当这点合格后,我们才能说这个研究是稳定的。当重复的效应量远远小于初始的效应量的时候,这说明原始研究的结果可能被大大地高估了。从这点来看,大样本的随机对照研究和元分析可以为这个研究结果提供更好的估计。但是上述的方法都无法掩饰的一个重要问题是,在一个领域最开始的研究中,负面的结果常常会被忽视,或者在之后的重复研究中,这种负面结果要面临着巨大的阻力才能发表,甚至在一些情况下完全得不到发表。
这正是在前几年学者John Ioannidis 所指出的,并且至今都在激烈讨论的问题:所有发表的研究结果都可能存在一些问题。而原因正是上面提到的(发表偏倚,即倾向于发表显著结果),而媒体在其中更是起到了推波助澜的作用。
媒体对于科学成果的传播
目前,只有很少的研究者系统地研究了媒体对于衰减效应的作用,但是这些少量的研究却大大地丰富了我们的视角。法国国立波尔多第一大学的研究者François Gonon和他的团队在研究中指出,媒体以及依托其中的公众讨论对于这个现象影响颇深。他们研究了上文中提到的ADHD的例子:研究者首先搜索出这个领域被媒体引用和转载最多的十篇文章,这十篇文章都对这个领域的做出了一定的开创性进步,虽然结果耳目一新但也存在一些争议。随后他们追踪了这十篇文章相关的后续研究,发现十篇中只有一篇的结果依旧保持稳定。在剩下的九篇研究中,有的实验结果被之后的实验否定了,有的效应量相较于初始实验大幅削弱。但是令人担忧的是,媒体依旧报道着最开始的正面开创性结果,而对后续研究置若罔闻。并且这种情况不仅仅出现在一般的大众传媒中,就连一些高标准的专业杂志也会有此倾向。所以在很多情况下,即使一些研究成果早已被证明是错误的,最初的开创性错误结果却仍然根深蒂固的影响着公众甚至后续研究者的行为。因为媒体没有相关的报道,所以没有人能注意到这点。我在这里建议,对于这个现象感兴趣的读者可以看看网上现在对于ADHD的新闻报道和各种文字类或者图片类信息。你会发现:衰减效应在媒体中无处不在,而至今对于ADHD的主流治疗方法依旧以最初的开创性错误结果为基础。
另一个关于媒体对于衰减效应影响的研究指出,媒体并不擅长(从论文中)识别出研究者是否对研究结果进行美化。特别是在研究并没有得到一个理想的结果时,作者会在摘要或结论中有意无意地以美化结果的方式错误解释他们的成果。有研究者随机抽取了70篇科学论文并分析了关于他们的近500篇新闻报道,发现接近半数的的文章在摘要中或者文章结论中有美化研究成果的痕迹。作者们把事实中不怎么“好看”的数据描绘成非常乐观且稳定的结果。所以当媒体报道研究结果的时候,也会携带这种偏误。于是公众们相信了这种描绘的很好但是实际上没有的那么好的研究结果,这也是衰退效应的一种成因。正如文章中一再强调的:新闻记者和科学传播工作者由于其知识很难意识到这种成果的美化,而他们的报道更是强化了这一点。研究人员在这篇研究的回归分析中发现,论文的作者们在摘要、图表处是否美化成果,是科学传播内容中出现偏误最重要的预测因素。(译者吐槽:说明新闻记者和科学传播工作者看一篇研究撑死了只会看看摘要,看看图表,就开始写写写了。。职业素养呢。。应该回去重新读《一个自由而负责的新闻界》)
所以对于一个有批判精神的读者应该牢记:新闻传播工作者们实在是太忙了,忙到了他们都不能完整精细地追踪一个科学成果及其后续。或者说是,他们只愿意看一个研究的摘要和图表,甚至就只是匆匆读一下摘要。当然,也有可能的是,这些新闻传播工作者并不合格。但对于大多数对科学研究领域陌生的公众来说,批判和详细分析地直接阅读一篇论文也是非常不现实的。所以对于媒体上报道(或者是炒作、宣传)出来的研究数据和结果,请一定要有这种意识:他们非常有可能在之后的研究中被证明是错误的。
我们该从这个现象中学到什么
第一点,一两只鸟叫不代表春天来临。所以对于科学研究一定要学会等待,是否后续研究会推翻最开始的结论。
第二点,盛夏总是很晚来或者完全不来(德国国情)。特别是在医药和健康领域,划时代的发现和突破是很少的,所以千万不要听风就是雨。
第三点,对于科学报道的一个小小的技巧:首先相信与报道中结果相反的那个结论。
Source: Walach, H. (2012, November 6). Decline-Effekte unddie öffentliche Repräsentanz wissenschaftlicher Ergebnisse in den Medien [Weblog post]. Retrieved from http://harald-walach.de/methodenlehre-fuer-anfaenger/decline-effekte-oeffentliche-repraesentanz-wissenschaftlicher-ergebnisse/
(译者注:在科学网上也有一篇关于讲衰减效应:http://blog.sciencenet.cn/blog-2369-894696.html,但是没有提媒体的作用。)
Literature:
1.Ioannidis, J. P. (2005). Why most published research findings are false. PLoS Medicine, 2(8), e124.
2. Gonon,F., Konsman, J.-P., Cohen, D., & Boraud, T. (2012). Why most biomedical findings echoed by newspapers turn out to be false: The case of Attention Deficit Hyperactivity Disorder. PLoS ONE, 7(9), e44275.
3.Yavchitz, A., Boutron, I., Bafeta, A., Marroun, I., Charles, P., Mantz, J., etal. (2012). Misrepresentation of randomized controlled trials in press releases and news coverage: A cohort study. PLoS Medicine, 9(9), e1001308.
翻译:刘拓,德国TU Chemnitz传播与媒体心理学硕士. 知乎账号:想成猫的狗
校对:王薇薇
编辑:陈圣栋