那些按照“最新研究”生活的人,会过得更健康吗?
The following article is from 返朴 Author 大猫、王晨光
撰文 | 大猫、王晨光
每天,全球各地的科学期刊都会发表大量关于生命科学和医学研究的新进展、新发现,其中一些会涉及健康、医疗和药物研发。这些研究成果通常也是健康领域新闻报道的来源;而在自媒体时代,这些信息会通过各种渠道快速送达公众,很多关注自身和家人健康的人们往往会从这些信息中寻找对维护健康或者治疗疾病有利的信息。
这显示出两方面问题:一是新闻媒体在传播有关医学、健康和生活方式等话题时所表现出的不专业,一些尚不成熟的医学进展被蓄意夸大,甚至那些停留在细胞水平、小鼠等模型动物中的研究结果,也被一知半解的媒体人直接照搬到人体;另一方面,受这些“二传手”媒体影响,缺乏判断力的民众直接用这些最新研究来“指导”自己的健康决策,而实际上这些研究结果大概率还远未形成定论。
本末倒置的媒体传播
JAMA杂志几年前发表了Ioannidis博士的一篇文章,系统分析了那些被Altmetic收录的、媒体高度关注的有关生活方式方面的研究论文,得出了一个结论:一些值得重视的健康问题和生活方式被有意无意地无视或忽略,而那些无关痛痒的枝端末节和缺乏专家共识的推测性结论却被肆意夸大。
大多数科学研究(无论其多么复杂还是投入了多少资源)很少会立即对日常生活产生影响,但关于生活方式方面的研究却不一样,它们会让人觉得和自己的生活如此相关,并且似乎具有很强的可操作性。这就可以理解,有关生活方式的选择问题会在公众话题中占据重要位置并受到高度关注。
Altmetric统计科学论文在新闻和社交媒体中获得的关注,并给出综合评分,每年列出评分最高的100篇文章。收录论文包括各种各样的研究内容,2017年和2018年引起人们最多关注的200篇论文中,有49篇与人们的生活方式有关。
Ioannidis博士的分析文章先列出了严重影响人体健康的生活习惯,抽烟是其中的头号恶习。21世纪,抽烟导致的死亡人数将会达到10亿人,而这完全是一个可以改变的行为。但是,在上述获得新闻和社交媒体报道最多的49篇与生活方式有关的论文中,没有一篇专门针对烟草滥用。大多数得分高的论文都与营养、饮食或肥胖有关(49篇中有29篇)。
肥胖也是全球性的重大健康问题,但在这29篇论文中,只有3篇直接涉及肥胖,其它26篇则讨论了诸如特定的营养素、食物、补品或流行的饮食方式等。这29篇与生活方式相关的论文中只有2篇报告称,所研究的目标对健康没有影响。引起最多关注的论文往往研究的是对健康风险很小甚至没有影响的因素。例如,有3篇广受关注的论文研究了咖啡是否有益于长寿。
即使论文报道的是具有健康高风险的因素比如饮酒(5篇),通常其重点也并没有放在酗酒行为的巨大且明确的已知风险上,而是关注少量饮酒的、不那么确定的风险。与之形成对比,选择吃什么以及怎么吃的论文却占了很大比例,例如吃某种坚果可以让人长寿、哪些饮食习惯跟哪些疾病有关等。
该分析文章的结论非常明确:在生活方式相关的科学研究领域内,更重大的健康问题在媒体传播上反而没有得到相应的重点关注。
作者认为,正确地向公众和媒体传播科学信息既是机遇也是挑战,这与公共卫生问题和大众对生活方式的选择息息相关。如果所传播的信息与肥胖症或高血压之类的重大健康问题有关,而且这些信息是真实的,则其益处将是可观的。相反,如果次要以及没有确切结论的话题占用了公众过多的注意力,对更关键的、具有更确定结论的问题及其解决方案关注较少,就会引起混乱。如此混淆主次甚至主次颠倒,可能会模糊关键的知识和科学答案。
另一方面,媒体传播的许多信息其实是没有科学界共识的,甚至是虚假的。有时关于同一问题的、得到高度关注的两篇或多篇论文会得出截然不同甚至相反的结论,饮食中脂肪和碳水化合物对健康的影响就是典型例子。在Altmetric得分最高的49篇文章中,大多数是观察性、非随机分组的研究,或基于此类证据的综述。
诡异的是,和没有得到显著结果的严密随机分组的研究(这类研究结论波澜不惊,但其实更可信)相比,观察性研究更容易上新闻。而观察性研究常常报道的是某个或某几个因素与健康状况的相关性,而不是因果关系,更不意味着对这些因素的调控能够改善我们的健康。这样看来,我们很难知道到底有多少被广泛吹捧的研究其实得出的是无用甚至是错误的结论。
出于主观的解读,媒体通常对一些鸡毛蒜皮的风险或获益因素添油加醋,诸如住在交通要道附近会导致失智、食用绿叶蔬菜可以降低失智风险、手机辐射会对健康构成影响——这类结论即使能建立起相关性甚至有一定的因果关系,这些因素的作用往往也小到不值得引起公众广泛关注的地步。这种不可靠信息还很容易被一些商家和其它非科学团体利用。
Ioannidis博士对媒体提出建议:为了让公共卫生行动有最大的收益,科学家和传媒界需要仔细选择传播的主题,这些主题应该有确定性的结论;科学期刊和媒体都应策略性地选择需要重点传播的公共健康主题,优先选择那些能解决主要健康风险的干预措施,并报道具有明确专家共识的知识;对存在偏差的观察性研究应该少在普及性杂志上发表,这些报告应放在专业期刊中,并在摘要中恰当地描述其局限性;新闻媒体应大幅度减少对此类研究的报道,这是媒体和传媒人应有的社会责任感,也是应该遵守的职业道德。
Ioannidis博士还建议,媒体也应避免发布来自对健康有重大负面影响的行业或其它团体在利益驱动下炮制的片面信息。例如,不承认吸烟和喝酒对健康有危害(甚至鼓吹对健康有好处)的商家应被禁言。当报道重大健康问题时,不仅科学期刊而且公共媒体也应声明作者是否存在利益冲突。
理解医学论文的基础
在上述认识的基础上,我们很容易理解民众直接用这些经过大众媒体二次解读的最新研究来“指导”自己的健康决策有多离谱。
即便跳过“二传手”、直接去寻找原始论文也靠不住,因为对于不具备专业知识的普通民众而言,理解一篇科学论文所描述的研究内容,并且能对结果做出正确判断是非常困难的。基于此,笔者不建议普通民众从新发表的科学论文中获取那些最新的、关于健康医学的知识。即便某项研究涉及自身利益(比如癌症患者恰好发现自己所患癌症的治疗进展),也要慎重对待,可以考虑向有专业背景的亲友咨询。
如果某读者对医学有特别兴趣,确实想全面了解某种疾病的最新医学进展,建议先从理解科学论文开始。只有全面了解一个领域的基础知识并懂得那些专业术语,才有可能正确理解一篇科学论文所呈现的内容,并做出这些内容是否对健康决策有帮助的判断。
根据NIH(美国国立卫生研究院)的建议,理解以下几个问题,可以帮助你理解科研论文的份量及其结论的可信度。
研究的目的是什么?要解答什么问题?
生命科学和医学基础研究旨在了解基本的生命现象、生理和疾病机制,转化医学研究的目的则是寻找疾病的诊治方法,以便为人体临床试验提供依据。基础医学和转化研究都可以在实验室中进行,也可以通过临床试验进行。
临床试验旨在测试一种诊断或者治疗方法的安全性和有效性,包括探索性研究和深入性研究。初步、探索性或试点研究为治疗方法的安全性和有效性提供依据,有助于确定是否要进行更大规模和系统设计的临床试验。
系统设计和精心策划的大型临床试验为一项诊断或治疗是否有效和安全提供更加可靠的依据。该过程设计和实施都很复杂,耗时较长且耗资巨大,通常仅在较小规模的初步研究表明该治疗或药物有较大可能对患者有益时才展开。
如果涉及临床研究或者流行病调查,参与人群的规模有多大?
对大数量人群进行的研究通常会得到比只有少量参与者的研究更为可靠的结论。更大规模的研究可以提高研究结果的准确性,降低研究结果的偶然性。但矛盾的是,规模越大,历时就越长,耗资也越大。统计学可以帮助估算临床研究所需要的参与者的规模。
临床试验方案是怎样设计的?试验中采取了哪些措施减少偏倚?
在对照临床试验中,研究人员要比较不同治疗组的效果,所选择的参与者在所有其它方面应尽可能相同。例如,可以将接受新方法治疗的一组(“实验组”)参与者的结果与接受标准治疗的另一组(“对照组”)的结果进行比较,对照组为实验组提供用于测量的标准。
对照组的设计在专业临床试验中也是很有讲究的,可以是给予没有药效的安慰剂,也可以给予当前临床上的标准治疗,实际情况中以后者居多。简单的、且比较理想的情况下,参与者被随机分配到其中的一个研究组里。这有助于确保两组人群除了治疗方式不同外,其它方面尽可能相同。多数情况下,对照组和实验组治疗以“双盲”的方式进行,即提供治疗的研究者和参与临床试验的志愿者都不知道他们接受的是试验药物还是对照药物,数据由第三方人员来掌握和统计。
这是因为在临床试验中,避免偏倚往往是非常困难的。如果患者知道他们接受了什么治疗,或者研究者知道患者接受的是哪种治疗,都有可能影响对于治疗效果的判断。
是否存在潜在的利益冲突?
在查看任何研究结果时,很重要的一点是要寻找潜在的利益冲突等产生偏倚的源头因素。了解谁为该研究提供资金,研究人员是否和研究内容存在利益关系,是否有来自其它独立来源的类似证据等。这些信息大部分能在文章里找到,因为大多数医学期刊都要求作者提供利益冲突声明和相关财务关系的信息。
该研究结果与以前的研究有何异同?
关于治疗方法是否有效和安全的最有力证据应是来自不同研究者的多项研究结果。一项研究很少提供最终的、确定性的结论,需要重复研究,包括使用相同方法但不同研究者和参与者的重复研究。此外,分析多项研究结果并严格审核数据质量的独立评估很有价值,这些评估称为系统评价和荟萃分析。
当研究结果被描述为具有统计学意义但没有临床意义( statistically significant difference vs clinically meaningful difference)时,意味着什么?
“具有统计学意义”意味着研究组之间的差异可能不是偶然的。“临床显著性”是对研究中观察到的效应(疗效)的量度。例如,一项研究可以发现两个治疗组之间存在统计学上的显著差异,但差异还没有大到可以明显影响病人的临床治疗效果,因而认为它们对患者的治疗不具有临床意义。
中国有句老话,久病成医。无论是患者还是其家人,在忍受病痛折磨时、尤其是遇到眼前的疾病尚无成熟的治疗方案时,转而去寻找最新的治疗方面的研究进展,这种心情完全可以理解;但多数情况下,我们依然不能鼓励那些不具有专业知识的民众从最新研究成果中寻求治疗手段,尤其是因此而改变或者放弃现有的治疗方案。
参考文献
[1] Neglecting Major Health Problems and Broadcasting Minor, Uncertain Issues in Lifestyle Science. October 18, 2019. doi:10.1001/jama.2019.17576”
[2] Ioannidis JPA. Neglecting Major Health Problems and Broadcasting Minor, Uncertain Issues in Lifestyle Science. JAMA. 2019 Dec 3;322(21):2069-2070.
[3] Ranganathan P, Pramesh CS, Buyse M. Common pitfalls in statistical analysis: Clinical versus statistical significance. Perspect Clin Res. 2015;6(3):169-170.
[4] https://www.nih.gov/about-nih/what-we-do/science-health-public-trust/checklist-communicating-science-health-research-public
更多精彩: