查看原文
其他

数据集不好,满配分析也容易竹篮打水一场空!盘点那些不能用的数据集

锦鲤 挑圈联靠
2024-08-23

欢迎来到锦鲤许愿池~


上期需要“拉黑”的数据集对你有帮助吗?本期继续带来没有解决方法、可以直接弃用的部分数据集(GEO)!能够通过一些操作及时解决的问题数据集,将在今后的更新中为大家说明。如果你在研究过程中发现了其他暗藏雷区的数据集,欢迎在文末留言和大家交流喔~!


拉黑原因包括:无差异基因、加药/特殊处理。







GSE185952

GPL平台:GPL30862

疾病类型:甲状腺相关眼病 Thyroid-Associated Ophthalmopathy(TAO)

问题原因:无差异基因


该数据集的p adj.>0.05,无法使用。

GSE92681

GPL平台:GPL16956

疾病类型:牙髓炎 Pulpitis

问题原因:无差异基因


该数据集的p adj. >0.05,无法使用。

GSE44593

GPL平台:GPL570

疾病类型:重度抑郁症 Major Depressive Disorder(MDD)

问题原因:无差异基因


UMAP聚类无法将疾病/对照组测序数据区分出来。



GSE68183

GPL平台:GPL16686

疾病类型:糖尿病足溃疡 Diabetic Foot Ulcers(DFU)

问题原因:无差异基因


样本来源于不同分组但无差异,在数据集GSE80178被整体用作对照组。

GSE20194

GPL平台:GPL96

疾病类型:乳腺癌 Breast Invasive Carcinoma (BRCA)

问题原因:加药处理


患者接受6个月的术前 (新辅助) 化疗,对术前化疗的反应被归类为病理学完全反应并用作预测的终点D。

GSE42568

GPL平台:GPL570

疾病类型:乳腺癌 Breast Invasive Carcinoma(BRCA)

问题原因:加药处理


50例患者接受辅助全身化疗(CMF/-阿霉素)。

GSE9103

GPL平台:GPL570

疾病类型:肌少症 Sarcopenia

问题原因:加药处理


受试者在试验期间需要输注葡萄糖以维持正常血糖。参考文献PMID:18716044

GSE107850

GPL平台:GPL14951

疾病类型:胶质母细胞瘤 Glioblastoma (GBM)

问题原因:特殊处理


样本做过放疗,参考文献PMID:34362400

该文献研究了放疗和放疗+TMZ治疗患者的生存情况。

GSE87211

GPL平台:GPL13497

疾病类型:Rectal Cancer (READ)直肠癌

问题原因:特殊处理


样本做过放疗,参考文献PMID:29119627





想要高效发文的朋友们快来投奔挑圈联靠的站姐——雪球老师吧!跟着大部队走,这是生信发高分的最快途径了~


如果你想做课题设计优秀的生信,想获得拆解的原文献,或者想收看最新的直播课程,就扫描下方二维码添加雪球老师微信获得更多资讯吧!2024下半年,卓越计划也在火热招生中,从底层逻辑讲到顶层建设,生信界的黄埔军校也是欲学从速的!



都看到这里了,点个星标再走吧!

继续滑动看下一个
挑圈联靠
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存