听说你的样本是PDX模型?(三)|单细胞专题
上一期我们讲过,如果是使用PDX模型作为测序的样本,由于肿瘤组织浸润的特性,通常在样本当中会混杂有不同来源的细胞,在进行测序数据的分析之前需要通过软件来对来源于小鼠的reads进行去除(听说你的样本是PDX模型?(二))。
在高通量测序的应用中,单细胞测序这一新技术已经成为当红炸子鸡,以其精细到细胞级别的分辨率在各种不同的领域开疆拓土。
不过由于其reads结构的特殊性,我们可以想见使用常规的方法直接对raw reads进行处理,可能并不一定能够得到好的结果。不过鉴于10x genomics单细胞测序会基于barcode将reads分配到不同的细胞,我们可以以细胞为单位来对数据进行处理和过滤(毕竟同一个细胞的来源总是固定的,不可能有一个细胞既包含小鼠的转录本又包含人的转录本是不是?)
10x genomics官方是针对这种情况有推荐的pipeline的,在官方开发的Cell Ranger软件当中有一个multigenome模式,该模式下会对测试数据针对两个不同物种的基因组数据库同时进行比对和cell calling,在得到细胞之后,根据同一个barcode下分配到2个基因组中的reads数量和比例,判断细胞归属于哪个基因组,或者被判定为多细胞(multiplet)。
上图是使用多物种模式进行分析得到的人鼠混合细胞的结果,使用的基因组分别为GRCh38和GRCm38。可以看到分别有2869个细胞和3385个细胞被分配到了人和鼠,另外数据中还有121个细胞被鉴定为multiplet(图片中未体现)。经过这样处理之后,如果关注的主要是人的细胞,那么就可以将人的细胞所属的barcode单独提取出来,来开展后续的下游分析。
当然,如果我们有与直接取自患者的肿瘤组织的单细胞测序数据合并分析的方案,我们需要注意,由于这里基底细胞多属于小鼠而被去除掉,PDX样本中获得的细胞类型可能与人源肿瘤样本存在较明显的差异。
当然,官方推荐的细胞鉴定标准可能只是一种基于质量较好的测试数据得到的标准,实际数据当中可能会有部分细胞呈现出较难区分的情况(例如细胞整体RNA表达量较低)。
所以在文献当中,针对PDX模型产出的单细胞转录组测序数据,有的时候也会采用与10x genomics官方略有差异的办法。例如在2020年发表的一篇Genome Medicine中,研究者就采取了更严格的方法,包含另一物种reads超过1%的barcode就被移除。
针对人和小鼠存在的同源性导致的细胞来源分配不清,在文献当中有据可依的情况下是可以采用比官方推荐流程更加严格的过滤标准的。当然在采用更严格的过滤标准以后,得到的有效细胞数量也会更少。这里就需要我们在数据准确性和数据量之间进行一个平衡。如果打算利用PDX模型开展实验,这里是在实验设计之初就需要考虑好的问题了。
关于联川
杭州联川生物为全球各地的科研用户提供基因组、转录组、蛋白组、代谢组,以及单细胞和空间组学测序服务。单细胞测序作为联川战略发展方向,在组织解离和单细胞生信分析方面充分发挥自身优势,为客户提供优质的服务。目前已经与100多个国家及地区的科研院校、医院、制药公司建立起了长期的合作伙伴关系,累计发表单细胞测序相关的SCI论文近百篇,影响因子平均15+。
相关阅读
Immunity:FFPE空间转录组揭示肾细胞癌异质性| 空间转录组专题
Cell:单细胞测序揭示重症COVID-19以髓系细胞失调为标志 |单细胞专题
炎症性肠病样本的单细胞研究总览,还不快来围观?| 单细胞专题
点击下方图片进入云平台资料汇总:
所见即所得,绘图高规格联川云平台,让科研更自由