常规收集医疗数据开展观察性研究，结果和讨论怎么写？

医咖会医咖会 2021-01-15

内容来自《药物流行病学杂志》2019年第28卷第3期，原题目为《使用常规收集医疗卫生数据开展观察性研究的报告规范（药物流行病学版）》。文章译自：BMJ, 2018, 363: k3532。译者申明：RECORD-PE规范中文版翻译得到RECORD指导委员会授权、认可发表。译者为聂晓璐，武泽昊，赵厚宇，詹思延，孙凤，彭晓霞。

将这篇文章分享给医咖会的伙伴们，希望大家能从中有所收获。

（感谢彭晓霞教授的授权）

之前的文章对RECORD-PE 规范进行了系列介绍，详见：

今天这篇文章，我们将继续对报告规范中研究结果、讨论部分相关条目进行详细说明，并同样辅以实例解析。

研究结果

1.REC0RD-PE 规范条目

对于结果部分，在先前的 STROBE 规范以及 RECORD 规范推荐的条目中，无需特别在 RECORD-PE 规范中说明。

1.2 解释

STROBE 规范中推荐，研究人员需要报告研究的每一阶段中纳入的个体数，以及排除的原因。RECORD 规范进一步强调了报告如何基于数据质量、可获得性和链接进行筛选数据的重要性。在 STROBE 和 RECORD 规范中均推荐使用流程图来说明研究人群的选择 —— 注意区分此图与 RECORD-PE 规范条目4.b中的研究设计图。

在药物流行病学研究中，高度的透明化也是十分重要的，因为常会运用额外的筛选标准（如基于用药的适应证、洗脱期及滞后期），增加了研究对象筛选过程的复杂性。研究人员需要报告所有阶段中纳人的研究对象人数，包括分析阶段的人数以及为了分析评估不同目标所用的人数（如亚组分析和敏感性分析）。

研究药物不良事件或反应的药物流行病学研究，应该报告研究者是否以及如何在个体水平上评估或者验证结局（如研究过程中由对暴露情况不知情的专业人员进行记录审查，以排除其他更可能引起结局的原因），这一过程可以用文字、表格或者流程图来描述在审查后有多少事件被认为是由所研究药物所引起的。

鼓励对由于缺少足够数据而不能明确划分为非病例或病例的研究对象数量进行说明（最终被设置为可能或不确定病例）。由Kaye等完成的关于口服抗菌药与肝脏损伤风险关联的文章中，图1就提供了良好范例。清晰划分选择过程有助于对研究结果的批判性评估，对研究结果适用性以及可重复性的评价。

关于描述性分析的结果，STROBE 规范推荐作者展示人口学分布、临床和社会特征的详细数据，包括有缺失数据的人数。

在使用常规收集数据开展的药物流行病学研究中，缺失数据普遍存在。在使用常规收集数据进行的研究中，研究者可能不知道诊断、症状和管理等的信息（缺失）究竟是没有记录，还是没有测量造成的。

队列研究也应提供随访时间测量的概述。对于基于常规收集的数据，RECORD 规范没有包括额外的条目。然而，就临床变量而言，药物流行病学研究需要报告所研究药物适应证的分布。也推荐作者总结药物暴露和非暴露的人时，包括如果合适的话，评价不同风险定义下“风险期（‘at risk’ periods）”的敏感性。此外，在药物流行病学研究中越来越多应用到时间依赖变量的情况下，作者应该考虑报告有时间变化数据的个体数量和特征。

RECORD-PE 规范支持 STROBE 规范中关于呈现结局数据、主要结果和其他分析的推荐。因此，研究人员应该将事件的数量或者测量结局的方法的小结（或者病例对照研究中的暴露情况）：未调整和调整的估计值以及他们的精确性、调整的混杂因子、将连续变量转化为分类变量的界值、对有意义时间段的绝对风险测量（如果相关），以及使用的其他分析（包括亚组分析、交互作用以及敏感性分析）等进行报告。

作者也应该呈现不同方法得到的结果，可能会包括常规分析方法和更加复杂的分析方法。如果使用了多种方法试图解释混杂（如匹配和调整），所有方法的结果都需要呈现并讨论不同之处。建议在倾向性评分匹配之前，呈现描述性分析的结果以体现协变量的分布（数量和百分比）；如果合适，也需要对进行倾向性评分匹配之后的分布进行呈现。作者需要清楚地叙述分析方法是预先制定还是事后分析。

推荐研究人员报告发现和处理缺失数据的详细结果，因为缺失数据在基于常规收集数据的药物流行病学研究中是十分常见的。

讨论(局限性）

1. REC0RD-PE 规范条目 19.1.a

描述所选择数据库充分捕捉待研究药物暴露情况的程度。

1.2 解释

作者应报告，如果没有在研究所使用的数据库中完全捕获药物暴露信息，所涉药物暴露是否可以由另一种来源确定。RECORD-PE 规范条目8.a 中概述的一些解释在这里也是相关的。

另一个相关的问题是，所研究药物暴露是否可以通过非处方途径获得，以及所用的数据源是否捕捉了这种使用。如果没有，作者可能需要探讨错分的可能程度。一个类似的情况是患者长期住院，而数据库没有记录医院内分配的药物治疗情况，那么错分也有可能会发生。作者也应该讨论数据库是否会有诊断、症状以及管理的信息，以及研究结果的应用。

1.3 在数据库中重复捕捉药物暴露信息的实例

Weistein等报告，该分析仅限于处方使用对乙酰氨基酚和布洛芬的情况，并不清楚这些结果是否会外推到非处方药物暴露。CPRD中，全科医生开这些药物的原因有很多，包括保持记录和让患者以较低费用获得药物，因为患者有资格获得免费药物。此外，长期使用这类药物的患者通常可能需要比处方药物更大的用量。因此，依据处方，可能将研究人群倾向于患有慢性病、经济水平较低的老年人。

SuiSSa报告，在图示中没有考虑到在标签日期前 30 d 期间无法测量的住院时间的简单方法，导致处方吸人糖皮质激素相关的死亡率在此期间内降低了40%。然而，在与之相同的 30 d 期间内有 806 例病例（死亡）住院，他们在本次分析中因为没收到处方被认定为未暴露。

这些病例在 30 d 内平均住院 16.2 d，在此期间他们无法收到门诊处方；而在对照组中，仅有253 例属于类似情况，平均住院时间为 8.8 d。事实上，在806例病例中有 190例 (24% ) 住院长达30 d，而对照组中仅有 7 例（3%）住院达 30 d ，这些人可能完全无法收到门诊处方。

讨论(解释）

1.RECORD-PE 规范条目 20.a

必要时，讨论潜在指示混杂、禁忌证或疾病严重程度引起的混杂，或潜在选择偏倚（健康依从者或虚弱的停药者）对研究结果的影响。

1.2 解释

正如在方法部分讨论的，指示混杂是解释药物流行病学研究结果时的重要问题，超出了使用常规收集数据开展研究的一般问题。

尤其是利用保险或者计费数据（如健康管理数据），研究对象的定义、药物暴露、混杂因素和结局均是基于已编码数据时，几乎无法获得描述药物治疗指征、患者和处方者个人偏好和价值观、任何潜在的禁忌证或疾病严重程度等信息，这些都会对药物与研究结局之间的关联产生混杂。

甚至在临床数据中（如电子医疗记录中的数据），也不可能记录用药指征或禁忌证，也不可能包含在自由文本字段中，导致研究者无法获得并使用这些数据开展药物流行病学研究。研究者或读者可能无法从研究报告中获得重要的混杂变量。因此，作者应该尽最大努力报告在常规收集卫生数据中可能存在的潜在混杂，以及总体上如何处理混杂。

推荐在结论部分（或在其他讨论部分）提供一个明确的声明来阐明结局是否可以通过指示混杂解释。这一声明有助于减少对决策制定的误导并提高证据和解释的可信度。

这份声明可以报告任何用以评估结果的稳健性和替代解释的事后分析——例如，评估不同暴露组患者是否会因为类似的情况开具处方。如果个体发生转诊或转移到其他保险数据库而无法被追踪到，作者应该清楚地概述个体的人时是否是唯一的（即仅从新注册的日期考虑）并且讨论丢失的既往暴露或事件对研究结果发现产生的影响。对因死亡以外的其他原因退出研究的人按年龄分组以及进入研究总体的人群的年龄分布绘制直方图也可能是有用的。

此外，正如 RECORD-PE 规范条目12.1.b 中所述，当采用了多种设计、设计特征或者分析方法时，作者应该阐明对不同方法所得结果的考虑。如果这些方法得到不一致的结果，那么上述这些信息尤为重要，因此需要规范呈现结果并科学释。

1.3 结果的替代解释实例

Sujan等报告，现有的研究结论应考虑一些局限性。首先，也是最重要的，当前的观察性设计无法完全找出所有混杂的来源。尤其同其他基于注册登记的研究方法一样，这种研究无法全面评估母亲的抑郁及其严重程度，也不可能比较不同抗抑郁治疗方法。因此，这种关联可能会受抗抑郁药的指示混杂的影响。

本研究采用多种设计来处理这一局限性，从而提供补充证据，每一种方法都可以帮助排除一些但不是所有的混杂来源。例如，同胞的比较可以排除所有稳定的混杂因素（如母亲的慢性抑郁），但这种设计可能无法考虑怀孕期间母亲抑郁情况发生变化所带来的混杂。因此与早产有关的家庭内因素，可能是由于无法测量的随时间而变化的母亲抑郁程度所引起，而非抗抑郁药物的使用造成。

Filion等报告，研究设计旨在考察药物处方限制对药物流行病学研究效果的影响，并以氟尿嘧陡/ 沙美特罗联合治疗为例。研究发现这些限制的实施会对药物的使用产生深远影响。

随着这一政策的实施，处方率和新使用氟尿嘧旋/沙美特罗的比例大幅下降。这些处方的变化导致了指示征引起通道效应和混杂，使得在采取限制措施阶段那些新使用氟尿嘧陡/沙美特罗的患者因呼吸系统原因的粗住院率显著提升[粗风险比（HR）=1.41，95%置信区间 (CI) : (1.32，1.51)]。

因为存在更多严重的潜在呼吸道疾病。对潜在的混杂因素进行调整后减弱甚至逆转了关联，与无限制时期相比，在限制期内的新用药者因呼吸系统原因住院率明显较低 [完全调整的HR= 0.78,95% CI: (0.73,0.83)]。

这些结果表明，处方的使用限制可以导致大量且无法预知的指示混杂，并且威胁到试验结果的合理性。这些结果也说明，由于处方限制存在，调整患者的人口统计学和临床特征不足以解释通道效应。因此，这样的限制必须在药物流行病学研究的设计和分析中纳入考虑。

Schneeweiss等报告，在病情较重的患者中使用抑肽酶而不是氨基己酸，并且在通过协变量调整控制混杂后，相对死亡率估计值有所降低，这与存在指示混杂的假设相一致。多因素分析发现抑肽酶与死亡之间的关联比未调整分析中报告的弱（未调整的相对危险度 1.83 ,调整的相对危险度 1.64 ）。

在高度选择的队列中采用倾向性评分匹配的方法调整了另外10个协变量，进一步降低相对危险度的估计。部分调整（而非全部）通常包含在进行了冠状动脉旁路移植术（coronary artery bypass grafting，CABG）患者风险预测评分模型中的协变量。

然而，研究调整了很多不包含在模型内的因素，如果代理因素捕捉到与真正的混杂变量、暴露和结局的关系，那么对混杂变量的代理因素控制就会导致对混杂变量本身的控制。对CABG术前的 41 项特征进行了联合调整，结果发现对住院死亡的预测效果与广泛接受的 CABG 患者的临床风险预测评分模型效果一样好。接受抑肽酶的患者和接受氨基己酸的患者的预测结果几乎相同。

更多阅读

1. 一表总结：医学期刊的统计报告要求

2. 医学论文中如何描述统计方法和统计结果

3. 一表总结：常规收集医疗数据开展观察性研究的报告规范

点击左下角“阅读原文”，看看医咖会既往推送了哪些统计教程。或者使用电脑打开网址：http://www.mediecogroup.com/，查看全部统计教程。有问题快加小咖微信（xys2019ykh），拉你进入统计讨论群！

观察｜官方通报陕西蒲城一职校学生坠亡：事发前与舍友发生口角和肢体冲突认定该生系高空坠落死亡

桐城一派｜倒在“跨年夜”的龚书记，13个字换来免职调查冤不冤？

比佟丽娅还恋爱脑，怀孕7次流产4次，目睹丈夫背叛却选择原谅

市管干部“龚书记”免职迷局

讣告！又一知名女星在家中去世，终年54岁，曾是无数人白月光…