请问你有什么证据?
这是因为疗效并非如我们想象的那样一望可知。
人类医学的历史虽然长达数千年,所谓的名医数不胜数,但古代医生的治疗措施,几乎都是无效的,人类的各个种族所以能够繁衍生息至今,而没有被哪一种疾病或瘟疫灭族,靠的并不是古代医学的庇佑,而是几百万年甚至更长久的演化力量赋予人体的免疫及修复功能。
无论在多么险恶的环境下,总会有人可以活到性成熟的年纪。
假设在前抗生素时代,我们悬壶济世走街串巷治疗了一百个肺炎,那么在概率上,也有一多半会痊愈,在痊愈的这部分病人中,如果恰好有一位是当地的大人物,经他一宣扬,那咱就是名医了。
如果运气不好,最先治疗的几个都死掉了,那为了避免被村民打死,赶紧拎着药葫芦跑路,这就是古代悬壶济世的真相。
古代医生的水平虽然不高,但医患矛盾也不见得就很严重,因为公众的预期与当时的医疗水平是相适应的,本来也没太指望请医生管用。
比如我国古代的笑话集《笑林广记》就收集了这样的笑话:
一医药死人儿,主家诟之曰:「汝好好殡殓我儿罢了,否则讼之于官。」医许以带归处置,因匿儿于药箱中。中途又遇一家邀去,启箱用药,误露儿尸。主家惊问,对曰:「这是别人医杀了,我带去包活的。」
有医死人儿,许以袖归殡殓。其家恐见欺,命仆随之。至一桥上,忽取儿尸掷之河内。仆怒曰:「如何抛了我家小舍?」医曰:「非也。」因举左袖曰:「你家的在这里。」
这两则笑话大概是反映了当时较高的小儿病死率,古代人平均寿命一直不高,就是因为有许多夭折的孩子,把平均寿命拉了下去。
当然,古代不止是小儿科的医生水平不高,给成人看病的那些,水平也不咋地,看这个笑话:
大方脉采住小儿科痛打,旁人劝曰:「你两个同道中,何苦如此。」大方脉曰:「列位有所不知,这厮可恶得紧。我医的大人俱变成孩子与他医,谁想他医的孩子,一个也不放大来与我医。」
一个给大人看病的医生和一个小儿科医生不顾斯文扫地地一通乱打,旁边不解,给大人治病的医生解释说:「诸位有所不知,这家伙实在太可恶。我医治的大人都投胎转世成小儿让他医,可他医的小儿,一个也没活到成年来给我医。」
敢情这无论是给大人看病还是给小儿看病都是往死了治呢。
古代西方的情况也一样糟糕。
17 世纪的英国医学家西德纳姆对当时英国流行的繁杂草药配方持批评态度,对病人他主张尽量少用药物干预,他认为医生所能做的最好的事情就是给人体以能够发挥其自愈能力的机会,而服药放血或许只会阻碍这个过程。
18世纪的《穷查理年鉴》有这样一条箴言:「知道大多数药物毫无用处的医生才是最好的医生。」
美国 19 世纪的医学家霍姆斯(Oliver Wendell Holmes,1809-1894)曾说:「我坚决相信,要是将所有通行药物都沉入海底,那对全人类都有好处,鱼儿可就遭殃了。」
一些学养深厚的医学和研究者对疾病的自愈倾向和医药的局限早就有深刻的认识,实验医学先驱贝尔纳(Claude Bernard, 1813-1878)在反驳「医学只是一门艺术,注定不会成为一门科学」时曾说:
「艺术家是在艺术作品中实现他个人特有的思想或感情的人,如果说存在一位根据他个人特有的思想或感情来治病的医生,那么我们怎么评价他呢?
当一位伟大的画家或一位雕刻家创作了一幅美丽的图画或一尊卓越的雕像后,没有人会这样想:‘这尊雕像也许是从泥土里长出来的吧,或者这幅图画也许是自动绘成的吧……’
然而,在没有艺术家(医生)干预的情况下,疾病能够很好地自愈,证据比比皆是,那么,医术的标准又在哪里呢?
人们不会凭一位医生说他治好了多少病人来判断他的功绩,首先,他应该科学地证明,这些病人是他治好的,而不是病人自愈的。」
至于究竟应该如何科学地证明,贝尔纳并没有进一步阐释,因为在当时,循证医学的方法尚未完备,个别医学家灵光乍现的一闪念,尚不足以为这一问题提出完美的解决方案。
三、
那么,我们今天应该如何证明某种疾病是治好的,而不是病人自愈的呢?
这就涉及到疗效判定问题了。
除了前面提及的疾病自限性的问题,很多人之所以会对疗效判定产生极大误会(主要是把无效的认定为有效)还可能是因为安慰剂效应或诊断错误。
比如有些神医宣称治愈了一些绝症,这其中除了有可能是癌症本身的自愈而外(按照严格的癌症自发消退的标准,曾有学者检索了1966年到1987年的文献,发现有504例癌症自愈的,实际发生的数量,应该远在这个数字之上),还有可能是把某种良性病误诊成了癌症,那些原本就没有致命危险的良性病,胡乱怎么治疗都有可能获得长期存活。
曾有一个病人在某医院诊断为肝癌后,自服某种偏方又继续存活了十余年,76岁去世,死前他将偏方献出,希望能够造福他人,尸检结果发现,他得的根本不是肝癌,而是血管瘤。
安慰剂效应可能是医学史上最具迷惑性的现象,不但病人长期以来将这种效应归功于医生的治疗措施有效,就连很多医生也身陷其中当事者迷。
结论:这位意呆利医生发明的手术对心绞痛无效。
这一历史教训有没有让你觉得脊背发凉?
如果不经严格的疗效判定程序就推广某种治疗方式或药物,那得让多少人深受其害啊?
事实上,仅在近百年以来,这样的悲剧就屡次发生过,更别说更久远的古代了。
安慰剂效应是指由于非活性的物质或无效的治疗所产生的医疗作用,包括任何医疗处理、手术、药物,甚至医生的语言态度和医疗环境本身都具有这种心理暗示作用。
大家有没有这样的经验:本来很难受的,可一见到医生就觉得缓解很多?
安慰剂效应一般不会被主流的医学界认为有很高的医疗价值,因为它没准,效果极不稳定,时灵时不灵,关键时刻肯定误事。
正因为安慰剂效应的这个特点,就被各种神秘主义钻了空子,他们用来辩解的话术就是:心诚则灵。
这一说法倒也不完全是谎言,有研究表明,那些无主见,缺少自信和容易受暗示的人,安慰剂效应容易起作用。
因为我们倾向于犯一种「证实性偏倚」的错误,即一个人所持的信念决定了他所能看到的事物。
对于现代医学研究者来说,我们要想找到真正有效的治疗,就必须将优于安慰剂效应的真正有价值的部分甄别出来,这是一个拨云见月的过程。
如果监管机构眉毛胡子一把抓,不做严格地验证就草率地承认任何宣称有效的治疗,那么很多真正有价值的医疗措施可能就会被长久地湮灭在一堆垃圾之中,而无效甚至有害的治疗也会危害到很多人的生命健康。
俗话说真金不怕火炼,确实有效的药物或治疗方法,一定是非常乐于接受严格的检验的,只有居心叵测的骗子才会千方百计地逃避这一验证过程,他们能找到的对自己有利的证据,只能是经过他们精心遴选的成功的个案,如果把他们的全部数据都公之于众,骗局也就无法维系了。
所以,一种新药或疗法在临床推广之前,必须经过医疗监管部门的严格审批,完成 3 期临床试验。
通常来说,判定疗效的原则是「无效推定」,即「疑‘效’从无」,凡是未经过规范的临床试验证明有效者,应默认为无效。
而考虑到药物的毒副作用时,原则是「疑‘毒’从有」,凡是未经过规范临床试验证明其安全者,应默认为有毒性。
在完成安全性的验证之后,临床试验必须设可比的对照组,采用随机分组,明确疗效指标,双盲法观察效果。
我们稍微解释一下为什么要这么做。
为什么要强调可比的对照组呢?
比如我们要验证某种药物对某疾病的治疗效果,就必须保证治疗组和对照组的病情和身体状态是近似的,倘若用一组年轻人和老年人做对照,或者用轻症病人与危重病人做对照,那很可能会得出错误的结论。
为了避免偶然因素的影响,我们需要进行随机分组和较大的样本数量,为了避免主观因素对疗效判定的影响,我们必须采用盲法。
我们今天已经知道维生素 C 对普通感冒无效,但在设计试验验证时,也曾发生过一些令人啼笑皆非的趣事,本来试验组口服维生素 C 片,对照组口服乳糖片,受试者原本是不知道自己吃的哪种,可有一部分人咬碎了药片试图猜测自己吃的是什么药。
结果就导致在疗效判定时得出维生素 C 有效的结论,但如果只在未猜出药物成分的两组志愿者之间比较,就会发现两组没有差别。
经过了这样的临床试验验证之后,我们方能承认该试验得出的结论为支持某种药物或疗法的医学证据。
那么事情到此为止就结束了吗?
并没有。
证据金字塔
因为单独的一次试验,哪怕设计的再规范,也仍有可能由于偶然因素产生误差,为了最大程度地避免这些误差的影响,研究者就需要把不同国家、多个试验中心的数据进行合并,这一过程被称为「荟萃分析」(即Meta Analysis,系统评价)。
至此,我们再回头去看我国学者对证据的定义:证据是经过系统评价后的信息。