查看原文
其他

SAS实例教程:配对样本的t检验

2017-01-05 杨超 医咖会

1、问题与数据

某研究使用克矽平治疗矽肺病患者10名,分别测得治疗前、后患者的血红蛋白含量(g/dL),数据如下。试问该药对矽肺患者的血红蛋白含量有无影响?



2、对数据结构的分析

整个数据资料涉及1组患者(共10名),每名患者有治疗前、后2个数据,采用自身前后对照设计,测量指标为血红蛋白含量,因此属于配对设计定量资料


要想知道克矽平对血红蛋白的含量有无影响,前面已经讲过,可以分析治疗前、后血红蛋白含量的差值0相比是否有统计学意义。若2组数据服从正态分布的要求,可选用配对样本的t检验。下面我们来看看SAS是如何操作的。

3、SAS分析方法

(1)数据录入SAS



(2)利用proc univariate程序,对差值(dif)进行检验→run。


4、结果解读



(1)前2个表格给出了血红蛋白含量差值的基本统计量,包括均数、标准差、方差、峰度、中位数等。




(2)正态性检验表格给出了正态性检验的结果,Shapiro-Wilk检验的P值=0.9402,表明数据符合正态分布。


样本量50例以下常用Shapiro-Wilk检验,50例以上多用Kolmogorov-Smirnov检验,当例数>2000时,SAS不显示Shapiro-Wilk检验结果。对正态性检验结果不必苛刻和死板,因为其检验方法比较敏感,即使数据略偏离正态分布也会得出一个较小的P值,而大多数统计方法对轻微的正态性偏离都有一定的“抗性”,数据略偏离正态时,其结果仍是稳健的,此时可以结合直方图、PP图或QQ图等进行综合判断。




(3)位置检验表格给出了分布检验的结果,分别为t检验、符号检验、符号秩检验(即Wilcoxon配对检验)的差值与0比较的结果。本例数据符合正态分布,则选择t检验的结果。


(如果不符合正态分布,则选择符号秩检验结果)

5、撰写结论

使用克矽平治疗前、后,矽肺患者的血红蛋白含量差值为(0.2±1.0)g/dL,尚不能认为克矽平对矽肺患者的血红蛋白含量有影响(t=0.531,P=0.609)。

6、延伸阅读

本例如果按照前后测量设计的重复测量资料分析方法进行检验,其结果与配对样本的t检验结果完全相同,但是它们却是两种不同类型的设计。实际工作中,重复测量设计常被误作配对设计或随机区组设计进行分析。


之前已经讲过,配对样本的t检验适用于3种情况:(1)同一研究对象给予处理前、后比较;(2)同一研究对象给予不同处理比较;(3)不同研究对象配对后,随机接受不同处理比较。配对设计的同一对子内,2个实验单位可以随机分配处理,可以同期测量结果(如第3种适用情况);而重复测量设计的时间点不能随机分配,也不能同期观察实验结果。


关于配对设计、随机区组设计和重复测量设计资料的区别及各自的统计分析方法,会在今后的专题中详细阐述,敬请期待。


(如果你想使用文中数据进行练习,请随时给小咖(微信:xys2016ykf)发消息,小咖将原始数据发给你。)


研究进展精彩回顾

1. 柳叶刀: 2016年医疗大事件盘点

2. 精读JAMA:体外受精会增加乳腺癌发病风险吗?


研究方法精彩回顾

1. SPSS详细教程 | 配对样本的t检验

2. SAS操作教程 | 两个样本均数比较的t检验

医咖会微信:medieco-ykh

关注医咖会,轻松学习研究方法

我们建了一个微信群,有临床研究设计或统计学方面的难题?快加小咖个人微信(xys2016ykf),拉你进群,和其他小伙伴们一起交流学习吧。


点击左下角“阅读原文”,看看医咖会既往推送了哪些研究方法。还可以到医咖会公众号下方的自定义菜单,点击“直接搜索”,查找你想了解的内容。

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存