查看原文
其他

学徒作业-我想看为什么这几个基因的表达量相关性非常高

生信技能树 生信技能树 2022-08-10
不知道多少人看完了全网第一个单细胞课程(免费基础课程),免费学习地址在B站:https://www.bilibili.com/video/av38741055  而且完成结业考核20题:https://mp.weixin.qq.com/s/lpoHhZqi-_ASUaIfpnX96w  ,作业里面有一个头颈癌单细胞的,课程配套资料(主要是代码和PPT)文档在:https://docs.qq.com/doc/DT2NwV0Fab3JBRUx0
发表于2017年12月,在CELL杂志:Single-Cell Transcriptomic Analysis of Primary and Metastatic Tumor Ecosystems in Head and Neck Cancer 的文献,找到单细胞转录组表达矩阵,数据公布在 GSE103322 ,文件是 GSE103322_HNSCC_all_data.txt.gz,有86.0 Mb。
  • 研究人员用Smart-seq2建库方法得到的单细胞转录组数据经过QC后,留下了来自18名患者的5,902个细胞
  • 首先使用inferCNV可以分成2215个恶性细胞和3363个非恶性细胞
  • 对进行3363个非恶性细胞表达矩阵分群,根据已知标记基因(自行搜索)的表达,注释并且找到B细胞,巨噬细胞,树突状细胞,肥大细胞,内皮细胞,成纤维细胞和肌细胞这8类!
重新看这个文章的时候,发现里面有这样的一个图表,如下:
上皮细胞的标记基因热图
上皮细胞的标记基因如上所示,它们居然表达量如此相关,而且恰好与inferCNV的恶性与否对应上。所以我安排这个学徒作业,大家下载GSE103322_HNSCC_all_data.txt.gz文件,绘制上面这个图。
其中inferCNV区分细胞恶性与否,如果你感兴趣原理可以看我以前在单细胞天地的教程:使用inferCNV分析单细胞转录组中拷贝数变异 ,但是第一步3个输入文件就制作失败,值得单独写教程强调一下这个解决方案。当然了,如果你还卡在第一步安装R包,请看我昨天在生信菜鸟团的教程:有些R包是你的电脑操作系统缺东西,但也有一些不是  。
inferCNV区分细胞恶性与否
当然了,inferCNV非常难,你很大概率上是搞不定的哈,但是我相信这篇文章肯定是有inferCNV结果,你可以直接使用即可。

文末友情宣传

强烈建议你推荐我们生信技能树给身边的博士后以及年轻生物学PI,帮助他们多一点数据认知,让科研更上一个台阶:

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存