查看原文
其他

探秘乳腺癌病人异质性

生信技能树 单细胞天地 2022-06-06

呐,等你关注都等出蜘蛛网了~


不知不觉在单细胞转录组领域做知识分析也快两年了,很幸运聚集了五个小伙伴携手共进,我们承诺不间断更新5个月,把我们这两年的学习成果全部掏出来给大家,包括5个栏目:

  1. 文献速递(简短介绍,扩充知识面)

  2. 文献详解(图文并茂带来大家系统性学习)

  3. R与Bioconductor的技巧(书籍翻译,妙招共享)

  4. scRNAseq的GitHub的书籍翻译(原汁原味的名校教程)

  5. 全网第一个单细胞转录组视频教程学习笔记分享


希望大家能有所收获!


现在你看到的是文献速递


文章信息


本期文章题目是:Single-cell RNA-seq enables comprehensive tumour and immune cell profiling in primary breast cancer. 于2017年5月发表在nature communications



背景

单细胞转录组在癌症研究领域应用价值很大,包括:

  • Non-invasive monitoring of circulating tumour cells

  • estimation of tumour heterogeneity

  • early detection of small numbers of recurrent tumours

  • sensitive monitoring of rare cell populations


 

招募的乳腺癌患者基本情况

虽然只有11个病人的数据,但是涵盖了4种乳腺癌的分类

  • ER-positive (BC01 and BC02; luminal A)

  • ER/HER2-positive (BC03; luminal B)

  • HER2-positive (BC04, BC05 and BC06; HER2)

  • triple- negative (BC07–BC11; TNBC) invasive ductal carcinoma

因为提取的单细胞并没有进行FACS筛选,所以包括以下

  • 癌症细胞

  • 非癌细胞

    • fibroblasts

    • adipocytes

    • endothelial cells

    • diverse immune cells





单细胞转录组数据

用的是microfluidic chips捕获单细胞,建库是SMARTer Ultra Low RNA Kit 去除低质量细胞:

  • (1) number of total reads;

  • (2) mapping rate;

  • (3) number of detected genes;

  • (4) portion of intergenic region.

去除低质量基因

  • First, TPM values < 1 were considered unreliable and substituted with zero.

  • Second, TPM values were log2-transformed after adding a value of one.

  • Third, genes expressed in < 10% of all tumour groups were removed.

最后剩下 515单细胞和17,779基因!

单细胞转录组数据在 :GSE75688 可以下载,里面也包括了bulk的转录组数据。

Bulk tumor transcriptomes showed significant correlations with the average of single cell transcriptomes.


外显子数据

外显子测序用的是 SureSelect XT Human All Exon V5 kit,illumina测序仪的PE100,走的是标准肿瘤外显子流程,找somatic mutation用的是mutect软件,CNV分析用的是Control-FREEC ,肿瘤约100X,正常对照组织约50X。

外显子数据在 SRP067248 可以下载,共24个测序文件。

肿瘤外显子数据分析结果都放在附件,应该是作者认为不是本文的亮点,就是有哪些突变信息描述一下,然后提到一下TNBC的拷贝数变化剧烈这个现象。


CNV对细胞进行分类

总共的 515单细胞根据CNV模式可以分成

  • 317 epithelial breast cancer cells

  • 175 tumour-associated immune cells

  • 23 non-carcinoma stromal cells

这里的CNV分析算法相比broad提出的算法改进了,采取了GTex数据库的breast组织的表达信息做过滤。183 mammary tissue data from GTEx portal (gtexportal.org/). 如下图:




区分成功了肿瘤细胞与否,就能对每个病人的不同细胞类型进行比较,比如分组计算表达相关系数,结果如下;



同一个病人的肿瘤细胞及其非肿瘤细胞的区别变化范围很大,说明了其异质性。


很明显,对恶性细胞来做主成分分析后聚类发现每个病人都聚成自己独立的类,而对非肿瘤细胞来说,会根据细胞类型来聚类,不同的个体这样的影响因素很小,如下图:




功能分析

检查了包括:

  • epithelial–mesenchymal transition (EMT)

  • stemness

  • angiogenesis

  • proliferation

  • recurrence

这些重要的功能通路。


计算一下signature scores

这里使用的是 ESTIMATE 算法:

  • Tumour score

  • Stromal score

  • immune signature

这些计算都是为了说明同一个病人体内取到的单细胞的确应该分类,而且不同的类别差别很大,如下图:





两个重要的R包:

  • GSVA software in the R package

  • Molecular subtypes of tumours were predicted using the R package genefu.

    • ER module score

    • HER2 module score




如果你对单细胞转录组研究感兴趣,但又不知道如何入门,也许你可以关注一下下面的课程

单细胞天地欢迎你


 由于文章链接较多,点击阅读原文,体验更佳



您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存