一定要阳性吗
要不是这三年疫情,作为科研工作者,应该是没有人不喜欢阳性吧。通常情况下我们的定义的阳性是有信号值,证实了自己的生物学假设,在统计学领域阳性基本上就是统计学显著性,是大家喜闻见乐的。比如生存分析作为目前肿瘤等疾病研究领域的点睛之笔,我们就会想方设法调整阈值拿到那些具有统计学意义的影响生存的基因,无论是保护因子还是风险因子,都是需要是阳性。我在生信技能树多次分享过生存分析的细节
人人都可以学会生存分析(学徒数据挖掘) 学徒数据挖掘之谁说生存分析一定要按照表达量中位值或者平均值分组呢? 基因表达量高低分组的cox和连续变量cox回归计算的HR值差异太大? 学徒作业-两个基因突变联合看生存效应 TCGA数据库里面你的基因生存分析不显著那就TMA吧 对“不同数据来源的生存分析比较”的补充说明 批量cox生存分析结果也可以火山图可视化 既然可以看感兴趣基因的生存情况,当然就可以批量做完全部基因的生存分析 多测试几个数据集生存效应应该是可以找到统计学显著的! 我不相信kmplot这个网页工具的结果(生存分析免费做) 为什么不用TCGA数据库来看感兴趣基因的生存情况 200块的代码我的学徒免费送给你,GSVA和生存分析 集思广益-生存分析可以随心所欲根据表达量分组吗 生存分析时间点问题 寻找生存分析的最佳基因表达分组阈值 apply家族函数和for循环还是有区别的(批量生存分析出图bug) TCGA数据库生存分析的网页工具哪家强 KM生存曲线经logRNA检验后也可以计算HR值
但是并不意味着阴性就不能发表,下面分享一个案例:
在2016的文章:《Germline CDKN2A Mutation Status and Survival in Familial Melanoma Cases》,确实可以看到统计学显著是生存分析结果,可以说明CDKN2A基因的重要性 :
但是在2019的文章:《CDKN2A germline mutations are not associated with poor survival in an Italian cohort of melanoma patients》,共检测1239例皮肤黑素瘤患者的CDKN2A突变状态,然后根据家族史和CDKN2A突变状态分配随访方案,CDKN2A种系突变阳性患者(MUT+)的随访更为频繁。从这个队列中, 选择了106名MUT+患者(黑素瘤家族史或明显散发性黑素瘤)和199名CDKN2A种系突变阴性(MUT嵴-)患者,两组患者的年龄、性别匹配,肿瘤分期相似。但是很明显,生存分析没有统计学差异:
但它不能否定CDKN2A基因的重要性。
其实阳性结果和阴性结果都值得思考
作为四大临床医学期刊之首,《新英格兰医学杂志》鲜有发表与统计相关的文章。2016年,杂志却破天荒的连续发表了两篇与统计相关的综述性文献——临床试验结束后,“阴性结果”和“阳性结果”该如何解读。虽然文章已经发表了5年,但是不得不说,顶级期刊所发表的文章极具启发性,文章中的很多观点,对后续临床研究结果的解读非常具有帮助。
对结果和研究的一些有益的思考策略。
阳性结果,思考:
P<0.05就足够好吗? 获益程度有多大? 临床上,这一主要研究终点重要吗? 获得次要研究终点的支持了吗? 重要的亚组获益一致吗? 样本含量足够大?结论足够可信吗? 研究被提前终止了吗? 安全性问题会抵消获益吗? 疗效及安全性的均衡是患者特异性的吗? 研究设计及执行存在缺陷吗? 研究结果适用于我的患者吗?
阴性结果,思考:
有潜在获益的趋势吗? 把握度是否足够 主要研究终点是否合适(被准确定义) 研究对象是否合理? 治疗剂量是否合理? 研究执行过程是否有缺陷? 非劣效结论有意义吗? 亚组分析是否有积极信号? 次要研究终点有阳性发现吗? 改变分析方式有帮助吗? 有更充分的外部数据吗? 是否有充分的生物学依据支持这一治疗?
文末友情宣传
强烈建议你推荐给身边的博士后以及年轻生物学PI,多一点数据认知,让他们的科研上一个台阶:
数据挖掘(GEO,TCGA,单细胞)2022年5~6月场,快速了解一些生物信息学应用图表 生信入门课-2022年5~6月场,你的生物信息学第一课