【April聊统计第一期】两种方法的应用--诊断试验与相关分析
在科研或临床工作过程中,经常需要对突变检测的效果进行评价,一般这种情况,都会优先考虑用统计学中诊断试验的方法进行评价。
接下来April会以一个典型应用场景进行举例,展示做评价的套路:(请注意分析所用数据均为虚构,结论可能与科学研究不符)
首先我们很想知道组织样本和血液样本在检测突变水平上的差异,例如:“与组织样本相比,血液样本的检测灵敏度和特异度以及两者一致性情况”。
其实用一个四格表就能很简单的描述问题。
假设多例患者配套的组织和血液样本进行检测,获得了组织和血液样本的突变检出情况。April最关注的是Hot Spot 位点,如 EGFR T790M位点(肿瘤靶向耐药位点)。这时候,就可以用四格表来展示两种类型样本的检出情况。
Table 1.两种样本检出情况:
公式1:灵敏度、特异度及一致性计算方法:
结果解读:血液样本相较于组织样本的灵敏度为84.62%,特异度为97.50%,以及两者的一致性为94.34%。
通过对单点检测水平的分析,发现相比于组织检测结果,血液样本检测T790M位点的灵敏度、特异度和一致性均比较高。
由于选用的是配套样本,我们还可以用McNemar检验判断两类型样本是否有统计学差异,用kappa一致性检验来判断两类型样本检出的一致性情况。(本文为了更方便地展示结果,我们在这里用SAS 软件,当然你也可以用其他分析软件)。
代码如下
data Kappa_analysis;
do TissueT790M=1 to 2;
do ctDNAT790M=1 to 2;
input f@@;
output;
end;
end;
cards;
11 1
2 39
;
proc freq data=Kappa_analysis;
weight f;
tables TissueT790M*ctDNAT790M/nopercent nocol norow chisq agree;
test kappa;
run;
结 果
结果解读: McNemar检验P值为0.5637,表示两类型样本检出无统计学差异;Kappa 一致性检验中Kappa一致性系数为0.8430,且一致性有统计学意义(Z=6.1458,P<0.0001)。
除了关心检出的有无的差异,我们也关心两种类型检出突变丰度的一致性(差异)。
首先我们可以通过简单的作图,来大致判断两种类型样本检测的突变丰度范围和差异为了方(tou)便(lan )使用Prism软件进行作图:
我们观察到两种样本检出的突变丰度有所差异,血液样本检出的突变丰度要低于组织样本的突变丰度。
更进一步地,我们想知道这个差异到底是因为实验因素等随机产生的,还是因为组织和血液样本本身不同产生的。
要进行两种类型样本检出突变丰度的定量,我们第一反应是用 t 检验来判断两组检测结果有无差异。
用配对t检验来分析组织和血液样本检出突变丰度的差异是否具有统计学意义。简单讲就是两组差值与0进行比较,如果差值均值与0相差较大,则提示差值可能具有统计学意义。
代码如下
data test;
input tmaf pmaf;
d=tmaf-pmaf;
cards;
0.1661 0.1041
0.1901 0.0258
...(省略中间数据)
0.1727 0.0392
0.0381 0.0524
;
run;
proc univariate normal;
var d;
run;
结 果
结果解读:正态性检验结果显示不符合正态分布(P<0.0001),应当选择符号检验结果。符号检验显示差值与0相比有统计学差异(P<0.0001)。提示同一患者的组织样本和血液样本检出突变的丰度不同。
除了两种类型样本检出突变丰度不同以外,我们还想知道两个突变丰度之间有没有联系。我们可以用相关分析方法来研究两者的关系。
代码如下
data test;
input tmaf pmaf;
d=tmaf-pmaf;
cards;
0.1661 0.1041
0.1901 0.0258
...(省略中间数据)
0.1727 0.0392
0.0381 0.0524
;
run;
data test;
input tmaf pmaf;
d=tmaf-pmaf;
cards;
0.1661 0.1041
0.1901 0.0258
...(省略中间数据)
0.1727 0.0392
0.0381 0.0524
;
run;
proc univariate normal;
var tmaf pmaf;
run;
proc corr pearson spearman;
var tmaf pmaf;
run;
结 果
结果解读:两组定量资料的正态性检验结果显示不符合正态分布(P<0.0001),应当选择Spearman相关分析的结果。Spearman相关分析结果显示,组织突变丰度和血液突变丰度之间的相关系数为0.63,有统计学意义(P<0.0001)。
至此,我们对于组织和血液两种样本检测结果分析已有初步了解,“好奇心“是不是被勾起来了,篇幅有限,下期再见~
小鸟经验,希望对初学者有所启发。
文字:April
编辑:Anymore
作者原创作品,未经授权禁止转载!
扫码关注,获取更多精彩内容
我
是
彩
蛋
关注公众号后:
回复文字:好好学习,收听喜马拉雅FM电台栏目《一分钟听懂NGS基础概念》,让生信分析不再遥不可及。
回复文字:果然科学,给你看另一篇好玩的文章。