缺失值与混杂因素的处理方法 | 美国Top杂志《内科学年鉴》统计指南(三)
内科学年鉴(Annals of Internal Medicine)的统计分析指南(三)
美国医师协会的杂志Ann Intern Med(影响因子17.0左右)是医学界十分具有影响力的期刊。它里面有一份详细的投稿论文的统计学要求,我认为很多的东西是我们国内杂志社应该学习的,特翻译过来并进行解读。
我将分为4篇推文说明内科学年鉴的统计学要求。
第2篇 回归统计分析方法和效应评估
第3篇 缺失、混杂和P值
第4篇 Meta分析
有兴趣的朋友们可以一起学习和感悟!
第3篇 如何处理缺失值、混杂因素和P值的理解
1. 缺失值
对于缺失值,现在越来越多的文献进行了规定,Ann Intern Med也不例外,对此它说
1.1 对于研究因素的缺失。在包括协变量在内的研究变量。论文需要报告缺失变量的比例以及缺失数据的处理方法。在结果表格中,建议加一行或者一列陈列各个变量的及分组的缺失量。 避免用一个简单的数值后者哑变量设置的方式去展示和处理缺失数据,这样都会导致偏倚。
1.2 对于研究结局的缺失。 同样,也要报告研究结局的缺失比例。写出缺失的原因和处理方法、不推荐使用最后观察值法(last observation carried forward approach (LOCF))来填补数据,哪怕是protocol是这样设计的。即便缺失比例很低,作者应该尽量不要采用过时的或者有偏的方法去解决失访问题。合适的方法很多包括多重填补法、模式混合填补法、以及选择法等。不同的方法应该考虑数据缺失的机制。
2. 未测混杂偏倚的敏感性分析方法
混杂偏倚一般包括未测和已测,实际上我们常常挂在嘴边的混杂偏倚都是已测混杂偏倚,可以通过回归、配对、倾向得分方法进行处理。未测混杂偏倚怎么弄?国内文献很少提。Ann Intern Med提出了建议,采用敏感性分析的方法(sensitivity analysis). Ann Intern Med还推荐了一个未测混杂因素的控制方法--E value方法。有兴趣可以学习一下。
3. P值的理解
P值如何理解仍然是头大的事情,大咖纷纷打卡说不能过于依赖P值。对此,Ann Intern Med也说,理解统计结果时只盯着P值看,除此之外,要提供置信区间和效应值。不要认为P值小于0.05,在临床上就没有意义。
郑老师:我在这里也呼吁:大家无论报告OR值、还是均数的差值、率的差值,同时都需要报告置信区间和P值!
本篇就到此结束,欢迎继续关注!
更多相关内容学习:
1.临床研究基线均衡性比较除了用P值大小来反映,还可以用这种方法!
2.当代流行病学大神Rothman:关于P值的18个误读与真相
3.当正态、偏态、率的数据狭路相逢,如何绘制规范医学论文表格
欢迎关注本公众号,我们是资源的搬运工,所有科研资源全部免费下载:
1. 绝对干货满满!“2019年真实世界研究杭州培训班” 6讲PPT可以下载了!
3.《中国统计年鉴》1978-2019,巨量呈现40年全国各行业指标(包括卫生、人口在内)!
4. 问卷和量表如何统计分析?Amos亚洲一哥张伟豪"量化研究SPSS视频"下载!
5. 公共卫生研究必备:5次国家卫生服务调查100万居民分析报告
8. 中国70年人口变化数据:1949-2018《中国人口就业统计年鉴》
Ann Intern Med统计指南原文可以“阅读原文”