查看原文
其他

你以为的冷饭却是别人的香饽饽---11分铁死亡lncRNA读后感

shuanmen 生信人 2022-06-21
最近在关注BIB的时候,发现了一篇铁死亡相关lncRNA建模的文章,看完之后不禁陷入了沉思。BIB虽然被中科院赶到生物二区去了,但好歹也算是11分的生信top期刊,铁死亡这个方向的纯生信不管是基于mRNA还是lncRNA建模今年都算是快到退潮期了。这篇文章怎么就能在2022年还能冲上10+呢?从数据层面来说,应该是有自己的数据队列作为加分项。但从方法层面来说,建模方法和目前同一方向的已发表文章完全不一样应该就是文章另一个加分项了。
公开数据库纯生信
铁死亡5+热门思路
扫码抢购中


Ferroptosis-related lncRNA pairs to predict the clinical outcome and molecular characteristics of pancreatic ductal adenocarcinoma

其实和这篇文章情况类似的还有我们周一为大家分享的结直肠癌免疫lncRNA。Nature communications在2020年发表过一篇泛癌层面识别免疫相关lncRNA的文章,时隔两年能够再出一篇免疫lncRNA的文章是值得去关注和学习的。

Pan-cancer characterization of immune-related lncRNAs identifies potential oncogenic biomarkers


Machine learning-based integration develops an immune-derived lncRNA signature for improving outcomes in colorectal cancer

今年的这篇结直肠癌免疫lncRNA有何创新的地方呢?从数据层面来说,同样有自己的数据队列;除此之外,收集了大量的公共数据。从方法层面来说,采用了两种方式来识别lncRNA,甚至其中一个方法就是两年前的文章所开发的方法(ImmLnc);除此之外,文章遍历了101种机器学习方法旨在寻找针对当前肿瘤最优的建模方式。


看完这两篇文章,除了沉思之外,脑子里其实有一个巨大的疑问:铁死亡lncRNA今年还有没有一战之力?

为了解惑,我检索了目前已发表的铁死亡相关lncRNA生信文章。其中3分以上的一共39篇。每一篇文章我都针对性的记录了方法,数据和建模之后的结果,最后发现了很有意思的现象。从统计结果来看,一共涉及16种疾病。从各个文章对于铁死亡基因的定义,铁死亡lncRNA的识别过程和结果来看,方法各不相同(Pearson, spearman, ceRNA, cluster DE等);方法一致的文章阈值也不相同(相关性R正值,R绝对值,范围:0.2~0.5;p值范围0.0001~0.05)。

以肺癌为例,我们详细的看看情况:
34312372, FerrDb 174 ferroptosis gene, 1621 lnc (|R2 | > 0.3, P < 0.001), pearson
Signature 10lncRNA, AUC 0.761~0.781

34820377, FerrDb 283 ferroptosis gene, 590 lnc (|R|>0.4,P<0.001), pearson
Signature 6lncRNA, AUC 0.720

34367250, FerrDb 259 ferroptosis gene, 1138 lnc (R>0.4, P<0.001), pearson
Signature 10lncRNA, AUC 0.741

34217273, FerrDb 288; KEGG 25; MSigDb 40 3 database gene, lnc (|R|>0.3, p<0.001), pearson
Signature 7lncRNA, AUC 0.658~0.711

34249715, literature 60, lnc (|R|>0.4, p<0.05), pearson
Signature 12lncRNA, AUC 0.694~0.756

35093068, FerrDb 259, 1949 lnc (|R|>0.5, p<0.001), pearson
Signature 19lncRNA, AUC 0.745~0.778

34861872, FerrDb 259, lnc (|R|>0.5, p<0.001), pearson
Signature 9lncRNA, AUC 0.606

我们可以看到,同样是肺癌(为什么都是做铁死亡lncRNA还都能发我们先按下不表),哪怕都是从FerrDb获取铁死亡基因,都能存在巨大的不同。有的取了数据库全部的基因,有的取了driver和suppressor,有的甚至可能因为版本问题少了很多。此外,虽然都是用了Pearson来计算相关性,但是阈值都不一致。最后的模型当然也都不一样了,预测效能也各不相同。

其实这一系列的结论给了我们一个提示:目前迫切需要一个合适的综合分析方法来识别高度可信的铁死亡lncRNA;并且采用最优的方法来构建模型。

总结
课题没有思路,文章看得又蒙,光挠头发是没有用的。其实让你蒙圈的文章或许对你是最有用的。今天分享的两篇让人疑惑的文章,其实合起来看就是一个潜力巨大的思路。Nature communications的方法联合已发表文章中待解决的问题,那么一个稳定5分的思路已经呼之欲出了。毕竟,你以为的冷饭,在别人手里就是香饽饽。
公开数据库纯生信
铁死亡5+热门思路
扫码抢购中


纯生信热门研究路线



015+纯生信铁死亡最新个性化思路提取
02铁死亡联合单细胞RNA-seq和bulk RNA-seq强势回归
03近期热点洞察:癌症相关成纤维细胞(CAF)
04线粒体能量代谢途径在肺癌中的实战分析
05国自然不容错过新晋热点:脂质代谢

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存