计算校正 RR 的 8 种方法
关于 RR 的定义
首先,需要申明本文所说的 RR 是指,relative rate 或者 risk ratio ,而非 relative risk。具体的辨析,可见此前的文章:小心流行病学中的效应指标RR。
为什么要计算校正的 RR?
临床研究中,研究者为了校正混杂因素,在终点指标为分类变量时,通常会采用校正的 OR 最为主要的效应指标。这主要是基于以下两个原因:
校正的 OR 计算非常方便,可以直接通过多因素 logistic 回归获得
在事件率较低时, OR ≈ RR
但 OR 毕竟不是 RR, 两者的流行病学含义不同,适用的研究研究类也不同,且使用 OR 替代 RR , 往往会获得较高的估计值。因此,即便是计算不方便,使用校正的 RR 作为主要的效应指标其实非常有必要。
如何计算校正的 RR
Knol 等在 CMAJ. 2012;184(8):895-899.中 系统的梳理了文献中常用的计算校正 RR 的方法,总计有 8 种。这 8 种计算校正 RR 的方法,总结如下:
| 方法 | 原理简介 | 缺陷 |
|---|---|---|
| Mantel–Haenszel | 将协变量分层的 RR 按样本量大小分配权重后进行加权平均。 | 中度混杂情况下,有可能略微高估 RR |
| Log–binomial regression | 用 log 连接函数取代logistic 回归的 logit 连接函数 | 某些情形下(如连续协变量过多),模型不收敛。 |
| Ordinary Poisson regression | 带log 连接函数,泊松分布 的广义线性模型 | RR 的标准误过大 |
| Poisson regression with robust standard error | 三明治估计法估计标准误 | 估计的个体概率可能 >1 |
| Zhang and Yu estimation | 基于非暴露组的事件率 将校正的 OR 转换成 RR | 倾向于获得有统计学差异的结果 |
| Doubling-of-cases method | case 被用了两次,一次作为 case, 一次作为control 。相当年于一个 抽样为 100% 的 case-cohort 研究设计。 | RR 的标准误过大 |
| Doubling-of-cases method with robust standard errors | 三明治估计法估计标准误 | 标准统计软件没有提供此方法 |
| Austin estimation | 以 logistic 回归估计的事件率,分暴露组取均值后再取比值 | 强暴露效应和高事件率时,低估 RR |
如何选择校正 RR 的方法?
当协变量为1~2 个分类变量时,可用 Mantel–Haenszel 法估计校正 RR
当协变量较多时,可先用 Log–binomial 回归,如不收敛,则用稳健标准差版 Poisson 回归
如果需要报告个体概率,且 Poisson 回归估计的概率 >1, 则采用 稳健版 Doubling-of-cases 法
软件实现
除了 Doubling-of-cases 法,推荐的其他几种方法,在常规的统计软件包中,基本都可以直接实现。比如,SAS 中的 proc genmod 过程;stata 的 glm 命令; R 的 glm 函数;以及SPSS 的 genlin 过程。
具体可见下图:
此外,还有一些不推荐的方法 ,比如通过校正的 OR 转换成 RR,倾向性评分匹配,边际概率等,在 SAS 中也非常容易实现,可见此前的推文:Logistic回归得出是校正的OR?那校正的RR咋整?