查看原文
其他

中国撤稿率全球偏高:“论文工厂”出品有哪些特征?

全球实现健康的科研生态还有很长的路要走。



源:中国科学报、科学网(sciencenet-cas)



透明地发表有科学价值的原创成果






中国科学院院士杨卫担任浙江大学校长期间,曾处理过一件危急撤稿事件。2010年,该校某附属医院一组医疗人员向施普林格·自然旗下某期刊投递的一篇论文被发现存在数据剽窃。该刊主编建议采取“极端措施”:该集团旗下所有期刊禁止发表浙江大学所有投稿。


危急关头,杨卫随即联系该刊主编并承诺会严肃处理所有涉案人员,才使该校免受“极端措施”波及。最终,涉事论文第一作者被解聘,通讯作者两年停招博士生。


“不要在学术上游戏人生。”近日,杨卫在中国科学技术信息研究所和爱思唯尔共同举办的科研诚信研讨会上以实例警示科研工作者。


会议上,来自国内外的科研工作者和顶刊编辑就如何防治科研不端建言献策,并建议全球范围内的科研机构和实验室采取措施,营造更健康的科研生态环境。
01勿让“劣币驱逐良币”


近年来,指向中国作者的一些大规模学术不端事件,引发了一些学者对科研公信力的担忧。


例如,最近,《微处理器和微系统》期刊400多篇论文因涉嫌伪造广受关注,问题包括用同义词躲查重、引用虚假文献、重复他人图片等。


涉事论文大部分作者来自中国。该刊出版商爱思唯尔对相关涉事论文表达关切,并着手进行相关调查。


学术不端就像一颗“不定时炸弹”,一旦暴露,涉事者往往会名誉尽毁,并波及身边的人和所在机构。 


“学术不端行为不只影响个人的职业生涯,没有科研诚信,学术界就会完全失去公众的信任。”中国科学院古脊椎动物与古人类研究所研究员付巧妹说,学术不端可能误导后续的相关研究,导致科学研究走不必要的弯路。


更糟糕的情况是,有专家指出,一些人拿着“好看的实验结果”造成劣币驱逐良币的后果,令遵守科研诚信的学者式微。
02多网齐下 围堵不端


在全球范围内,针对各类造假现象,学术界也在通过各种方式鉴别学术不端行为,捍卫科学的尊严。


以图像造假为例,爱思唯尔旗下全科学开放获取期刊Heliyon(生命科学、物理学、社会科学与医学)主编Christian Schulz指出,由于数字工具的广泛使用,近年来图片处理不端行为日益增多,约有10%的已发表论文中存在可疑的数据,其中约有1%为故意造假。


“以此计算,过去10年中约有3000万篇论文发表,相当于300万篇论文数据是可疑的(数量相当于印度同期发表论文数量),故意造假达到了30万篇左右(相当于马来西亚同期论文产出)。”他说。


Schulz表示,通过建立大型数据库,人工智能已能在很大程度上通过相似度多少辨别一篇论文是否存在抄袭、剽窃。


现在,针对图片造假,Pubpeer平台匿名举报、一些专业人员的仔细筛查,让一些相关科研不端操作不断曝光。


同时,针对图片造假的智能化“打假工具”也在不断演进。


例如,哈佛医学院、维也纳大学正在开发图像识别软件帮助研究者更好地找到论文中一些重复的图像。


一些私营公司也在加入这一阵营。Schulz表示,科学期刊出版界也建立了生命科学出版机构研究组,以期开发更多工具,捍卫公众对科学的信任。


杨卫表示,21世纪以来,我国开展了整肃学术诚信的“六大战役”。


从设立学术不端举报机制、不再允许多种语言一稿多发,到进行相似度核查、开展全国范围内的大规模科研诚信教育培训,再到对大规模撤稿的调查、对研究可重复性与学术规范性调查,我国撤稿率逐年降低。


“2010年成为我国撤稿率发生变化的转折年。”他说,在此之前,我国出版物撤稿率是世界平均水平的6倍之多。目前,我国的撤稿率和世界平均相比仍然偏高,仍需进一步强化科研诚信体系建设。


“科学研究需要客观、诚实、严谨、透彻,从研究设计到数据处理,直至得到最终结果,都是如此。”付巧妹说。


同时,她认为,科研诚信还有一些更加复杂的问题,如数据、样本或研究方法以及数据解读等过程中的一些偏见问题。


这要求研究人员对自己的研究持“否定否定再否定”的态度,仔细检视研究是否存在问题,从源头避免可能存在的错误。
03营造健康科研生态


遏制学术不端,堵不如疏。此次会议上,专家学者建议改善目前的科研大环境,营造健康的科研生态环境,消灭学术不端滋生的温床。


“有很多压力促使科研人员发表论文,比如获得终身教职、获得资金。这个诱惑实在太大了,有些研究者可能会做一些他们后悔的事情,这确实造成了不好的生态。”《细胞》主编John Pham说。


《柳叶刀》高级执行主编和期刊学术伦理工作负责人Sabine Kleinert也认为,目前的科研文化亟须改变。


“大家发表科研成果时,考虑的问题可能是它能不能给我的简历添上一笔、对我的职业生涯有没有帮助。学术机构也会考虑论文的影响力和影响因子能否让它们获得更多项目资金。大学的排名也会以此为参考。”她表示,发表论文的作用由此被异化。
她表示,理想的状态是,有良好的科研环境,最高标准的科研诚信,透明地发表有科学价值的原创成果。“这才是科学研究的真正目的所在,我们应该朝这个方向努力。”Kleinert说。


付巧妹认为,在对学术不端零容忍的同时,也应容许科学家“犯错”。例如上世纪80年代,科学家从埃及木乃伊中获得的DNA样本被认为是一个里程碑式的研究,打开了一个新领域。


直到20年后,同一作者才发现其结果是由当时的DNA样本污染得出的。“对这类因条件限制而非故意造成的错误,需要思考是否给予一定的容错空间。”她说。


她表示,新的知识往往会随着时间的推移和科学技术的发展不断完善,最后形成成熟的理论。在这个过程中,对于一些早期提出的有争议的或者不准确的内容,与其直接全盘否定,不如给予更多的讨论和进步空间,营造更健康向上的科研环境。


会上,有专家认为,在某些领域公开一些研究错误有时非常重要,但现实中,大环境有时并不是很友好,错误可能会被无限放大。这可能让一个领域失去很多重要的发展机会,为此健康的科研环境也应完善容错机制。


在杨卫看来,全球实现健康的科研生态还有很长的路要走。同时他坚信,在科研诚信建设中,科学家是可以自我纠正、自我更新的。




“论文工厂”的造假论文有这8大特征






近日,发表在《欧洲生化学会联合会快报》(FEBS Letters)上的一篇文章揭示了论文工厂的原始真相。2018年以来,经过作者对多篇论文的调查研究发现,目前有数千篇论文可能来自论文工厂。
作者指出了论文工厂造假论文的8大特征:具有相似的文本和结构;可能存在造假模板,图像数据会在不同文章中反复使用;原始数据图像来自不同模块的排列组合;引用文献与内容毫不相关;不同作者从同一台计算机提交手稿……
01“论文工厂”造假论文:8个典型特征‍


2018年初,欧洲生化学会联合会(FEBS)出版社期刊编辑、德国海德堡大学生物化学中心的Jana Christopher等人发现了一种令人不安的潜在欺诈类型。一些论文手稿可能是按照某个模板来展示伪造数据的,这表明存在“论文工厂”:即出售假科学论文手稿的非法组织。
经过作者调查研究发现,自2018年以来,目前有数千篇论文可能来自论文工厂。
由诚信研究分析师、科学家、期刊编辑和记者组成的一个国际小组调查发现,论文工厂的服务可能包括数据捏造、出售作者、伪造同行评议和引用计划等。通常,这些论文手稿在多个方面都很相似,往往能顺利通过同行评审,且引用情况良好。
论文工厂对文献和后续研究的影响有多大尚不清楚。近两年,在生命科学领域大量可能出自论文工厂的论文被撤回。今年1月,英国皇家化学学会一次性撤回了68篇来自中国医院作者的论文,其中绝大部分出自知名大学或其附属医院。尽管如此,仍有数千篇此类论文尚待确定。
据报道,在伊朗、印度和俄罗斯等国均有论文工厂运行。除了生命科学领域的论文,也涉及人文社科、计算机科学和工程等领域。
Christopher指出,对于可能来自论文工厂的论文手稿,其指示性特征包括:
1.与其他论文/手稿的文本的相似性;
2.与其他论文/手稿在面板的组成和组织、注释样式、图表格式方面的相似性;
3.公式化的标题和结构;
4.杂志的稿件提交系统将稿件标记为,不同作者从同一台计算机提交;
5.作者使用商业的、非学术的电子邮件地址;
6.作者的ORCID ID(开放研究者与贡献者身份识别码)丢失或为空;
7.参考文献列表包含无明显原因的无关论文引用;
8.使用作者推荐的审稿人时,审稿时间异常短,且评审结果为肯定。
02案例解读 


案例1:论文工厂或存在造假模板
论文工厂似乎有论文模板,在几篇不相关的论文中,其文本、表格、图形的总体布局和设计十分类似。其图像数据被重复使用,不仅限于蛋白质印迹、显微照片等,还包括表格、散点图、条形图,甚至是数字。
图1显示了2018年10月,在《皇家学会开放生物学》上发表的两篇不相关文章中的重复图像和具体数字,分别用蓝色和紫色框标记,这两篇文章来自不同的作者,都在2020年7月被撤回。
图1 源自欧洲生化学会联合会快报(下同)
案例2:引用文献与内容毫不相关
可能出自论文工厂的论文还会互相引用,这增加了它们的可信度。
最近提交给FEBS的一份论文手稿中,描述了miRNA、靶点及在特定疾病中的作用,参考文献列表引用了几篇文献,但这几篇文献中既没有miRNA、也没有靶点、更没有相关疾病机制。这表明,这些论文纯粹是为了引用而列出的。
仔细检查4篇被引用的论文后,Christopher发现,每篇文章都包括一个条形图,值与新提交的论文手稿中的一个图形相同,但标签不同,设计和颜色也有所改变,见图2。这4篇文章来自中国不同医院的不同作者,发表在2种杂志上,Christopher等及时提醒了他们。 图2 案例3:原始数据图像的背景和内容可随意组合
对于Christopher等检测论文工厂论文工作而言,围绕图表的原始数据制定一项强有力的规范至关重要。
Christopher等还观察到,免疫印迹的原始数据经常会被操纵或完全捏造。据报道,生成对抗网络(Generative Adversarial Nets,一种基于人工智能的图像合成技术)可以通过计算机生成外观极为逼真的蛋白质印迹,创造出人们通常所称的“深度假货”。
图3显示了最近被撤回的一篇论文中的“原始数据”,这篇论文是在Christopher为其它杂志所做调查后撤回的。在PS中打开图像数据文件显示,在每幅图像中,这些条带都与背景在不同的层,也就是说,可以任意将不同行的条带与假背景结合,这可以生成25个代表了不同实验的单独图像。这个案例中,因为原作者没将这两个图层合并,因此可以清楚地追踪。
图3 案例4:需要原始数据时,论文工厂现做现发送
2018年,FEBS出版社的2家期刊收到了12份来自论文工厂的投稿:论文图像中所展示的免疫印迹的背景噪音在多个图,甚至多个手稿中都是相同的。这批手稿在短短几周内,分2-3批提交。后来,被FEBS出版社拒稿后,这12篇文章在其它期刊发表。
这些文章后被列入“蝌蚪论文工厂”清单,该清单由著名学术“打假人”Elisabeth Bik等列出,确定了近600份显示具有模板背景的特征性蛋白质印迹的论文。尽管这些图片看起来非常相似,但目前还不清楚所有这些论文是否来自同一个或多个论文工厂的模板。
这些例子表明,在缺乏真实数据的情况下,论文工厂为了向期刊提供原始数据,可能需要制作图像。 案例5:7篇论文同时出现低级错误
2020年,Christopher受命协助调查在FEBS以外的期刊上发表的大量论文。在被调查并最终撤回的论文中,Christopher注意到,几篇不相关的论文作者提供的免疫印迹原始数据存在相似性,数据呈现和排列等要素都非常相似,这几篇论文的作者没有重叠,彼此也没有从属关系。
图5展示了这6篇论文的原始数据图像,这和在同一时间提交给FEBS出版社的一篇论文的免疫印迹原始数据呈现模式相同。这7项研究没有联系,但其原始数据都有相同的布局:三个并排重复,每个印迹板中心的条带位置相似,所有图像的右上角都被以数字方式裁剪掉了一块。
图4(A,B)6篇论文中的2篇的免疫印迹原始数据。(C)在同一时间提交给FEBS出版社的一篇论文的免疫印迹原始数据。
在免疫印迹中,通常做法是将X射线胶片的一角剪掉,以确定胶片冲洗后的方向。这是物理的,也就是用剪刀剪掉。
然而,在这些例子中,裁剪是以数字方式完成的。可以想象,这是为了使图像显得真实故意这么做的,但如果不使用X射线胶片成像,使用数字成像的话,完全没理由这么做。
关注学术桥,关注科研人员发展本文内容及未标注图片来自网络,版权归原作者所有,仅供分享之用,不代表本公众号观点。如转载稿涉及版权等问题,请作者在两周内与我们联系或者请留言通知我们删除。来稿和内容合作信箱:qiaoqiao@acabridge.edu.cn

关注学术桥:联结全球 汇聚人才

延伸阅读

导师退休后24篇论文被撤回,2名已毕业5年的博士学位被撤销!如何应对?

中国培养STEM博士多于美国,我们应该如何看待这一现象?


全球高层次人才服务平台—学术桥

视频招聘会学术评审评估青年学者论坛


  欢迎联系我们:

  高校招聘,吴老师:19927471252

  人才求职,赵老师:13810238612


: . Video Mini Program Like ,轻点两下取消赞 Wow ,轻点两下取消在看

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存