Lancet: 警惕大数据真实世界研究中的诚信风险
2020年6月5日,柳叶刀杂志(The Lancet)撤回关于羟氯喹治疗新冠感染的大数据真实世界研究。该研究基于芝加哥一家小型公司提供的号称来自全世界几百家医院的数据,当文章受到质疑时,公司拒绝接受第三方对有关数据的独立检查,柳叶刀杂志因此撤回了该文章。同一天,新英格兰医学杂志(NEJM)也撤回了与该公司数据有关的另一篇文章。
2020年9月17日,柳叶刀就此事件发表“社论”文章,声明从即日起将采取更严格的措施,降低大数据真实世界研究和发表中不端行为的发生风险。有关措施包括作者声明、数据分享声明和同行评议程序。详细内容见下:
1)要求作者声明,至少有一位作者直接取用并查验过论文使用的数据;
2)并在作者贡献的声明中,指明是哪位作者取用并查验过有关数据;
3)对于学术和商业界合作的研究,至少有一个学术界的作者取用并查验过有关数据;
4)所有作者必须声明他们都具有该数据的取用和查验权,并为投稿的文章承担责任。
另外,国际医学杂志编辑委员会早就要求临床试验论文分享有关数据。这一次柳叶刀则进一步要求,所有类型的研究论文都必须分享数据,并且应声明:分享的详细数据内容、什么时候可以取用、取用的条件是什么,以及其他要分享的文件(如研究方案)。数据分享将是未来柳叶刀编辑考虑是否发表一篇论文的因素之一。
柳叶刀还声称,对于大数据真实世界的研究论文,柳叶刀主刊及其所有子刊即日起还将引入额外的同行评议措施,保证至少有一个同行评审者熟悉论文有关的同类数据,并能对利用此类数据回答有关研究问题存在的优点和缺点进行评论。对于基于特大数据的研究,不但会邀请统计学家评审,还将征求数据专家的意见。而且,柳叶刀还会直接征问评审专家,他们对一篇论文的研究诚信和发表伦理是否有质疑和担忧。
柳叶刀这篇社论提醒大家警惕的是真实世界大数据的真实性问题,是医学研究中的诚信问题,是所有研究中都可能发生的问题,还没有涉及到真实世界大数据用于医学研究所存在的、可影响研究结果科学性的固有问题,例如,数据来源的可溯性、代表人群的清晰度、测量的准确性和一致性、数据的完整性、各种可见和不可见的混杂因素,以及利用真实世界的观察性数据回答不同医学问题时可能发生的种种偏倚。
大数据真实世界研究是个新生事物,大和真看似都很有吸引力,而且还方便、快捷,但并不是不存在问题。如何正确利用它,这次柳叶刀撤稿事件应是一次十分有意义的反省。
柳叶刀社论原文(见阅读原文):
Learning from a retraction. Lancet, 17 Sept 2020.
编译:唐金陵,广州市妇女儿童医疗中心临床研究总监、《英国医学杂志》高级临床研究编辑、香港中文大学流行病学荣休教授
长按上方二维码关注我们