数据集不好,满配分析也容易竹篮打水一场空!盘点那些不能用的数据集
欢迎来到锦鲤许愿池~
上期需要“拉黑”的数据集对你有帮助吗?本期继续带来没有解决方法、可以直接弃用的部分数据集(GEO)!能够通过一些操作及时解决的问题数据集,将在今后的更新中为大家说明。如果你在研究过程中发现了其他暗藏雷区的数据集,欢迎在文末留言和大家交流喔~!
拉黑原因包括:无差异基因、加药/特殊处理。
GSE185952
GPL平台:GPL30862
疾病类型:甲状腺相关眼病 Thyroid-Associated Ophthalmopathy(TAO)
问题原因:无差异基因
该数据集的p adj.>0.05,无法使用。
GSE92681
GPL平台:GPL16956
疾病类型:牙髓炎 Pulpitis
问题原因:无差异基因
该数据集的p adj. >0.05,无法使用。
GSE44593
GPL平台:GPL570
疾病类型:重度抑郁症 Major Depressive Disorder(MDD)
问题原因:无差异基因
UMAP聚类无法将疾病/对照组测序数据区分出来。
GSE68183
GPL平台:GPL16686
疾病类型:糖尿病足溃疡 Diabetic Foot Ulcers(DFU)
问题原因:无差异基因
样本来源于不同分组但无差异,在数据集GSE80178被整体用作对照组。
GSE20194
GPL平台:GPL96
疾病类型:乳腺癌 Breast Invasive Carcinoma (BRCA)
问题原因:加药处理
患者接受6个月的术前 (新辅助) 化疗,对术前化疗的反应被归类为病理学完全反应并用作预测的终点D。
GSE42568
GPL平台:GPL570
疾病类型:乳腺癌 Breast Invasive Carcinoma(BRCA)
问题原因:加药处理
50例患者接受辅助全身化疗(CMF/-阿霉素)。
GSE9103
GPL平台:GPL570
疾病类型:肌少症 Sarcopenia
问题原因:加药处理
受试者在试验期间需要输注葡萄糖以维持正常血糖。参考文献PMID:18716044
GSE107850
GPL平台:GPL14951
疾病类型:胶质母细胞瘤 Glioblastoma (GBM)
问题原因:特殊处理
样本做过放疗,参考文献PMID:34362400
该文献研究了放疗和放疗+TMZ治疗患者的生存情况。
GSE87211
GPL平台:GPL13497
疾病类型:Rectal Cancer (READ)直肠癌
问题原因:特殊处理
样本做过放疗,参考文献PMID:29119627
想要高效发文的朋友们快来投奔挑圈联靠的站姐——雪球老师吧!跟着大部队走,这是生信发高分的最快途径了~
如果你想做课题设计优秀的生信,想获得拆解的原文献,或者想收看最新的直播课程,就扫描下方二维码添加雪球老师微信获得更多资讯吧!2024下半年,卓越计划也在火热招生中,从底层逻辑讲到顶层建设,生信界的黄埔军校也是欲学从速的!
都看到这里了,点个星标再走吧!