在随机对照试验(RCT)中,随机化保证了研究对象的各项基线特征(例如年龄、性别、疾病严重程度、伴随疾病等能够影响疾病预后的因素)在试验组和对照组之间的均衡性。
然而,RCT研究并非总是可行。
第一,对于需要很长时间的干预和随访来观察长期效应的研究,或者需要大量样本来观察罕见严重不良事件的研究,RCT并不是最理想的,因为它十分昂贵且需要耗费大量资源,实施起来也非常困难;
第二,当研究的干预措施具有一定风险时,随机分组则可能无法满足伦理要求,不能将患者随机分配到具有一定风险的干预组中。
针对这些情况,观察性研究可以提供更好的证据来源。实际上,越来越多设计规范的观察性研究被广泛应用到疗效比较中,甚至有学者认为观察性研究能够解决RCT在人群普遍适用性上的缺陷,从而提供最接近真实世界的疗效评价结果。
然而,在真实世界中,治疗方案的选择往往是根据可能影响患者预后的因素来确定的,而这些影响因素在暴露/处理组和非暴露/对照组的人群中常常分布并不均衡,这就导致观察性研究的结果可能会产生一定的偏倚。
为了克服预后因素分布的不均衡性,保证观察性研究结果的真实性和可靠性,我们可以从统计学的角度来对其进行调整和处理,常用的统计学方法包括分层分析(Stratified Analysis)、多因素调整分析(Multivariable risk adjustment)、倾向性评分分析(Propensity Score Analysis,PSA)、工具变量分析(Instrumnental Variable Analysis,IVA)等等。
我们将通过一系列的文章,针对观察性研究控制混杂因素的方法一一向大家介绍。
混杂因素
在介绍各种方法之前,我们首先要搞清楚什么是混杂因素,为什么调整混杂因素很重要。当我们想要评估某种干预措施的疗效时,最为理想的研究方案是,除了干预措施以外,其他所有可能会影响结局的因素,包括已知的和未知的因素,在两组研究对象之间均保持一致。
随机化是解决这一问题最理想的方法,但在观察性研究中暴露/处理因素往往是病人自行或被动选择的,从而导致暴露/处理组和非暴露/对照组人群之间的预后因素分布不均衡,使得真实的效应值被低估或高估,引起偏倚。这种现象我们称之为混杂(Confounding),其中引起混杂效应的因素被称为混杂因素(Confounder)。
混杂因素通常具备以下几个特点:
1、混杂因素必须与研究结局密切相关;
2、混杂因素又与研究的暴露/处理因素有关;
3、混杂因素一定不是暴露/处理因素和研究结局之间因果关系链上的中间变量,它们三者的关系如图1所示。
有一些混杂因素是已知的,并且可以被准确测量,但是还有很多潜在的混杂因素是我们未知且无法测量的,这些混杂因素也会对结果造成一定的偏倚,我们称之为残余混杂(Residual Confounding)。
为了控制混杂因素对研究结果的干扰,减少偏倚,我们需要对混杂因素进行一定的调整,使其在暴露/处理组和非暴露/对照组中分布均衡,才能更准确地探讨暴露/处理因素与研究结局之间的关联性,保证观察性研究结果的真实可靠。
分层分析
分层分析是一种常用的控制混杂因素的方法,它是将数据资料按照某个需要控制的混杂因素进行分层,然后再估计暴露/处理因素与研究结局之间的关联性。
分层分析的一般步骤为:
1. 计算总人群中暴露/处理因素与研究结局的效应值,即粗RR(相对危险度)或OR(比值比)值;
2. 将研究资料按照混杂因素来进行分层,计算各层内暴露/处理因素与研究结局的效应值,即分层RR或OR值;
3. 判断各层之间的效应值是否一致,即判断层间RR或OR值是否相近或同质。若各层之间的RR或OR值不一致,则不能合并,需要分层报告效应值。
4. 若各层之间的RR或OR值基本一致,则可以用M-H(Mantel-Haenszel)法计算合并的效应值,即调整(控制混杂因素后)的RR或OR值;再将合并的RR或OR值与分层前的粗RR或OR值进行比较。
若调整后的RR或OR值与粗RR或OR值不一致,可以认为分层因素存在混杂作用【《流行病学(第六版)》建议,差值在0.1以上(RR或OR<1时),或在0.5以上(RR或OR>1时)时,认为调整后RR或OR值与粗RR或OR值不一致】。此时,还要结合临床或生物学意义进行综合分析,而不应该仅仅根据统计学结果来判断。
研究实例
举一个例子,如图2所示,假设我们进行一个队列研究(队列研究是观察性研究的一种)来探讨某种处理的疗效,处理组和对照组各100人,其中处理组中有80人为年轻人,20人为老年人,而对照组中有20人为年轻人,80人为老年人。
经过一段时间的随访,处理组中死亡12人,其中8人为年轻人,4人为老年人,对照组中死亡18人,其中2人为年轻人,16人为老年人。直接计算处理因素的RR为12%/18%,即0.67,可认为该处理是有效的,能够降低33%的死亡风险。
(点击图片可查看大图)
由于年龄本身与死亡密切相关,且年龄在两组之间分布严重不均衡,年龄作为一个混杂因素,可能会对结果造成一定的偏倚。下面我们按照年龄进行分层,来重新评估不同年龄分层下的处理因素的效应值。
首先在年轻人中,处理组80人死亡8人(10%),对照组20人死亡2人(10%),处理因素的RR为10%/10%=1,在老年人中,处理组20人死亡4人(20%),对照组80人死亡16人(20%),处理因素的RR为20%/20%=1,将分层后的RR值进行合并计算,得到控制年龄混杂因素后的调整RR值为1,则可认为两组人群的死亡风险相同。
从这个例子我们发现,在未进行分层分析之前,由于处理组年轻人较多,而年轻人的死亡风险又较低,因此初步的结果倾向于认为处理因素可以降低死亡风险。但是按照年龄因素进行分层后,由于年龄在两组之间的分布严重不均衡,掩盖了处理因素的真实效应,在对年龄进行分层分析后,才发现处理因素实际上对于死亡风险并无影响。
分层分析局限性
在上述例子中,我们仅考虑了年龄一个混杂因素,并对其进行了分层分析,假设此时增加一个混杂因素——糖尿病,且糖尿病在处理组和对照组人群中分布也不均衡,我们就需要同时对年龄和糖尿病进行分层,即分为年轻糖尿病组、年轻非糖尿病组、老年糖尿病组和老年非糖尿病组,共4层,并在每一层下进行单独分析,最后将结果进行汇总。
如果再增加一个混杂因素——高血压,此时有3个混杂因素,就要分为8层(23)。若有n个混杂因素,则分层的数量即为2n。
在实际研究中,混杂因素的数量往往较多且非常复杂,因而研究对象就会被分割为很多亚层,计算就会变得非常复杂,同时每一层的样本量就会变得很少,结果也会很不稳定。并且对于连续性的变量,在进行分层分析时需要将其转化为分类变量,这样也造成了信息损失,降低了数据的利用效率。
因此,当我们的研究中存在较多的混杂因素,且混杂因素较为复杂时,应该如何对混杂因素进行控制和调整呢?我们将在下期内容中介绍更多实用的统计方法。
参考文献:
1. JAMA. 2017 Feb 21;317(7):748-759
更多阅读
关注医咖会,涨姿势!
有临床研究设计或统计学方面的难题?快加小咖个人微信(xys2016ykf),拉你进统计讨论群和其他小伙伴们一起交流学习;或者点击公众号下方自定义菜单的“统计咨询”,提出你遇到的统计难题。
点击左下角“阅读原文”,看看既往小伙伴们都提出了哪些问题,以及该如何去解决,也许正好能帮到你~