有所健鼠其二 | 2020年若还不首先搞明白【健康】两字到底是什么定义的话。。。
咖啡有益健康。
运动有益健康。
吸烟有害健康。
日常生活里天天会听到如此这般的表述。当一切感觉起来特别自然的时候,人类就会表现出一大特色,那就是→停止思考。
想过没有,到底什么是健康?想过没有,健康这两个字其实代表着一个非常复杂的体系?→不得感冒是健康,昨天晚上文章里提过的减少肚子上一圈的内脏脂肪也是健康,体重下降一定程度内可能也是健康。这也健康那也健康,定义却纷乱繁杂。在这样的情况下当你试图去表达『XXX对健康有益』这一话题时,无论表述本身有多么丰富,它们都存在一个共同的严重问题:相当主观、凭借感受、无法严谨评价、无法真正信赖。
在这样的状态下,中国就有无数人掉进了厂家为他们精心打造好的坑里,特别是那一代受教育程度本身就低、思辨能力弱、特别容易受周围亲朋好友隔壁邻居的游说印象的老年人们。这是因为当所谓健康两字从思维起步线上出发之际都没有一个严谨可操作的像样定义的话,10000个哈姆雷特心中就有10000个健康想象,厂家们根本不需要证明自己的产品是否真的能够带来严格定义上的健康,而只要说到目标对象的心坎里去,让他们在心情上感觉到了健康就足够了。而下一步,则自然开始了『韭逢知己千割少』的互害循环。
2020年如果想带领家人一起走出这一循环,我们自己首先需要真正花时间踏踏实实地弄明白什么才是科学上能够客观定义、衡量与评价的健康。如若不然则一切必然离不开主观体验感受领域,未来某一天你自身就很容易沦为下一波韭菜。
健康的定义
对于健康二字,世界卫生组织WHO是这样定义的:
Health is a state of complete physical, mental and social well-being and not merely the absence of disease or infirmity.
健康是指良好的身体、精神与社会参与状态,而不只是不生病或者不虚弱。
这,是从WHO宪章里截取的一段话。WHO宪章有过修改案,但内容大体上没有重大变化。全世界总体上对于健康的最宽泛理解恐怕不会和WHO有出入。是的,全世界所有人只要可能都应该努力追求这个方向,然而在严谨的科学面前,或者具体而言在认真周到的流行病学研究领域,却不得不最终必然倒向『疾病与衰弱』这样的结局(OUTCOME),也就是反过来走向了不健康三个字的定义。
Why?这是因为WHO宪章所谓的『身体精神社会等方面的良好状态』这样东西在科学上是很难量化分析、很难严谨评估的。举个栗子:『每天喝一杯红酒幸福感会up』这个话题本身有可能是事实,但如果想要正儿八经去研究的话应该如何研究呢?值得信赖的可靠研究可以说是零。直到近来一些走在前沿的机构譬如美国哈佛大学的Center for Health and Happiness↓终于开始了研究幸福度与健康之间关系等课题,燃鹅直到今天为止这一领域科学研究上对于健康定义的基调,毫无疑问是『疾病与衰弱』,关键就在于对其如何进行精准定义了,换言之就是对于何谓不健康的精准定义。
最强有力的健康定义
先上结论→
①全因死亡率。
②心血管疾患死亡率。
③癌症死亡率。
↑【死亡率】,是和『疾病与衰弱』最为关系密切的定义。那么死亡率的下降意味着什么?我们难道不明明是一辈子只死一次么?以及如果死亡原因想要怪罪在几乎不吃蔬菜的话,那又应该如何去证明这一点呢?所以死亡率也需要进一步精密界定。于是诸如『假定年龄、性别等各种条件都一样时今后30年内的平均死亡率』就成为了死亡率的精准定义,而多吃蔬菜有助于降低死亡率就可能表现为『其他条件都假定完全一样的情况下,当两人之间的差异只是一个大量吃蔬菜而另一个从来不吃蔬菜时,大量吃蔬菜的人比起从不吃蔬菜的人今后30年间的平均死亡率要低2%左右』。
死亡是结局的终点,死亡特别强有力。但死于心肌梗塞等心血管疾病和死于癌症时,背景是有相当大的差异的。所以虽然都是死亡率,科学研究中常常会把心血管疾患(心梗或者脑梗)的死亡率和癌症的死亡率分开评价。可能很多人都见过的最常见表达例子之一就是『每天坚持运动30分钟以上的人群今后30年间的全因死亡率以及心血管疾患死亡率会下降,但癌症死亡率没有显著变化』这样的描述。
所以说到死亡率这件事情,『今后多少年内』这个概念极其重要。假如你把死亡率定义成今后100年内的话,那对于绝大多数人而言无论膳食多健康无论多在乎运动无论多懂得调整自己的精神压力,基本上都已经直【挂】云帆济沧海,几乎没有任何意义了。而如果设定在今后1年间,那需要长期一贯坚持才能显露出益处的习惯譬如天天都坚持多吃蔬菜的效应可能会很低很低。So,多数流行病学研究会把followup的时间长度设定在5年到10年,而如果一项研究能够把长度设定到20年到30年的话通常就属于品质相当上佳的了。
比较强有力的健康定义
先上结论→
①心血管疾患发病率。
②癌症发病率。
③糖尿病、痴呆症等其他重要疾患的发病率(较①、②稍弱)。
之所以到这里就降到了比较强有力,是因为并不直接和死亡相关了。但即便如此心肌梗塞的发作和癌症的确诊,依然和死亡的预期密切相关,因此就被归到了比较强有力的(不)健康定义。这方面的表述案例有『禁烟对于预防肺癌的效果』、『红肉摄入与心肌梗塞的关联』等等。这里还特别要提一点,那就是考虑心肌梗塞这样的疾患时还需要周到地考量到『人死了之后就再也不可能再次发作心梗了』这样的细节(Competing Risk)。Competing Risk可能导致选择偏差,所以应该予以妥善的处理,但直到今天依然还有不少研究应对不足(Epidemiology. 2008;19(3):448–450.)。譬如『未来10年间的癌症发病率』就是典型的与癌症相关的不健康定义,而『未来10年间心梗发病或者心脏病死亡率』就是冠心病(Coronary Heart Disease,CHD)方面常用的定义之一了。
那么糖尿病和痴呆症等发病又怎么看呢?这类疾病当然也需要严谨考虑到终点,但相对而言确切的发病时期往往较为模糊,在研究解析的时候必须更加谨慎。
是的很累,哪怕只是看文字都觉得累。但科学如果不是这样严谨,那么产出的东西就和很多商家推销你的这个那个补品保健品一样,最好情况是没有价值,搞得不好则还有潜力让你一边付钱一边付出健康代价。有句烂掉的话在这里倒是非常应景而且恰当→哪有什么云淡风轻,不过是科学在替你负重前行。听上去特别简单流畅舒适的话背后,常常有着简化原因、混淆事实、颠倒因果甚至胡说八道的充分可能。那这样做的动机又是什么呢?2020年了,冷静想想应该能够明白。
较弱的健康定义:替代指标
先上结论→
①血液检查结果。
②血压。
③BMI等数值。
昨天晚上的文章提到了替代指标概念(Surrogate Marker)。BMI、LDL(低密度胆固醇,俗称坏胆固醇)、血压、糖化血红蛋白(HbA1c)等等,都可以用作替代指标(譬如考察心血管疾患的风险因子)。这些东西的好处在于随时可以比较精准地测量,常用被用作随机试验的终点(毕竟长时间追踪的随机试验是非常烧钱的)。具体案例譬如『红肉摄入短期内对于心血管疾患的风险有何影响』↓
↑这是一项针对24项随机试验(随机将大量进食红肉的人群与不食用的人群分开的研究)的荟萃解析,然后考察血压和胆固醇等指标上的变化。如果发现LDL上去的话,那么基于心血管疾患风险会因此上升的合理推演,研究就可以获得相应的洞察。
蕨经以前分享过,营养学领域在证据上常常面临严峻挑战,想要正儿八经搞个基于强有力健康定义进行精确考察的高品质随机研究相当困难。原因非常多,其中之一就是难以长时间地严谨followup——『你既然参加了红肉对于心血管疾患的研究你就绝对不允许吃红肉,10年里不许吃一口!』——这不但很难真正有效约束被研究的人群,而且非要下军令状的时候还涉及伦理问题。于是一言以蔽之:诸如『红肉与心梗发病的关系』这类研究是无法基于强有力健康定义去确立【因果关系】的。即便是高品质队列研究(Cohort Study),也很难一口就把『因为吃了红肉所以死亡率up』这句满嘴说死。但这个时候替代指标们因为可以通过随机试验进行考察,反而【有可能】提示因果关系→因为一天到晚大吃红肉所以LDL上去很厉害→LDL上去很厉害那么未来心血管发病风险就显然上升了——就是这样展开的逻辑链。所以替代指标们在健康定义本身比较弱,但在某些时候却相当『好用』。
但即便这样,依然很复杂。譬如就算基于随机研究发现LDL上去了,而且也的确提示有害身体,但LDL数值上升本身是否就是导致心梗或者脑梗的原因呢?其实不清楚。除非数值高得离谱,否则一般情况下效应真的没有那么显著。因此当你听说『随机研究发现XXX导致血压上升』的结果时,你的确可以因此产生XXX的确不太好的印象,但血压到底上升多少,对于疾病的发病到底有多大程度推波助澜的作用,则是另外需要考察的话题了。
所以营养领域很多厂家在随机研究的结果(OUTCOME)中应用的就是健康定义的替代指标。它们的共通点是证据(EVIDENCE)上比较弱(也就是终点可信度比较弱),但却常常宣传得比较夸张。这一点如果对于健康这两个字本身到底应该如何解读完全小白的话,一被隔壁王大妈张二嫂一游说的话是没有任何招架之力的。
很弱的健康定义
那就是主观的病情与症状等描述。
一旦终点里蕴含了主观要素,那么作为一篇垃圾公众号的话可以赚取无数眼泪与感动,但作为健康定义的话通常就很弱了。举个例子:『感冒发病了』。不要小看这么简单的一件事情,在一项随机研究中假如不呕心沥血地对参加研究的同胞们彻彻底底地说清楚到底所谓感冒发病的定义是什么的话,根本不可能最后导出值得信赖的OUTCOME。不要忘记那个貌似当年中国军队里出来的梗:行军时前面带队的对后面说『拉开距离!』,结果到了后面就理解为了『去牵头驴!』。。。所以通过一项队列研究去考察预防感冒的方法时,其本身的证据等级是相当弱的。但相对而言随机研究因为有各种办法进一步提高数据搜集的可靠性而会好不少,但证据的品质依然不甚理想。事实上很多人可能注意到有不少针对维生素D(VD)预防感冒效果的研究——到了2019年的一份研究提示了有效性(虽然证据品质不能说很高)。这是一项针对25项随机试验的荟萃解析↓(Health Technol Assess. 2019;23(2):1–44.)
其他带有主观性质的弱健康定义还包括『头痛』、『肚子痛』、『恶心想吐』等等。这类主观感受不仅受到自己主观体验的影响,而且还受到复杂的外因影响。对此流行病学研究采用半定量评价方式,但定义方面很弱。就如上文已经提到过的,队列研究在这方面很难形成可信证据,因此随机试验是个must,但即便是随机试验,结果的可靠性依然不能说有多高。
不可信的健康定义
先上结论→
①血管年龄。
②肠道菌群。
③血液流畅不再粘稠。
等等。到这里是不是读起来越来越轻松了,甚至好像闻到了一股熟悉的味道了?没错,这就是泛滥于街头巷尾的各类健康消息的论据所依附的根干。今晚读到了这里之后,当你看到『XXX改善肠道菌群』、『XXX逆龄了你的血管!』的时候,基本上就没有可信的了。道理很简单,这是因为无论是血管年龄也好、肠道菌群也罢,这些定义在目前严谨研究所积累的证据之下,不要说属于强有力的健康(or不健康)定义,就连替代指标都不够格。如果健康方面一样东西连替代指标都不是的话,那考察的价值何在?→就算变好了也完全不等于你会更加健康啊。
特别是『血液不再粘稠!』一说。血液粘稠不粘稠不仅算不上替代指标,其本身到底如何定量都很叵测。什么叫做粘稠?什么叫做顺畅?唯付想象。所以跑来日本的体检客人里有人问我『哎听说多吃纳豆能够让血液变得更加流畅不粘稠,真的咩?』——我想要告诉他的是你这话题的问法本身就已经是错误。就好像你实际上是想要知道晚饭好吃不好吃,结果你却问我早饭的餐具是否磨得锃亮一样。虽然纳豆作为发酵大豆制品经常食用有文献提示可能降低糖尿病风险,但那完全是另一个维度的风马牛不相及的话题了。。。
结论
除了高品质流行病学研究,大多数研究(常常不得不)权宜之计地引用了证据等级比较弱的健康定义。作为普罗大众,我们对于厂家宣传的解读务必要慎重。否则,韭逢知己千割少这句话,真有可能会在2020新年的某一天降临到你头上。今年春节餐桌上大家看电视打麻将过于疲劳反而睡不着觉的时候,不妨把这个话题拿出来对亲朋好友们说一圈,这样大家第二天早上一定会感谢你,说你给到了大家最好的催眠。。。
但至少对我个人而言,科学思维正是因为这样烧脑才充满魅力、如此性感。。。