10X单细胞3'转录组建库原理
10X Genomics公司的单细胞3'转录组解决方案主要有V2、V3两个试剂版本,V3版本是相对于V2版本的升级,实验过程和基本原理相同,以下我们将回顾10X单细胞3‘转录组的建库原理,其中会涉及V2、V3两个试剂版本在文库结构上的异同。
壹
Gel Bead schematic
Schematic of a SC3’ v2 Gel Bead oligo primer
Chromium Single Cell 3’ v3 Gel Bead schematic
V2和V3版本的实验过程和基本原理相同,用于生成3'基因表达文库的Gel Bead poly(dT) Primers差异主要是UMI随机序列长度从10bp增加到了12bp,UMI多样性增加,相应的Gel Beads上Primers的数量也从73多万种增加到350多万种,在相同测序深度下V3能发现更多的基因;GEMs(油包水)数量未有改变,还是能鉴定500-10,000个细胞。
除以上之外,Single Cell 3ʹ v3 Gel Beads还提供另外两种primer(Capture Sequence 1 and Capture Sequence 2),这两种primer能够分别用于Feature Barcoding技术的细胞表面蛋白表达鉴定以及单细胞CRISPR筛选,这两种后续文章会专门讲。
贰
主要实验过程
主要实验过程如下图
含有细胞的油滴占所有油滴比例大约5%,更好的保证了含有细胞的油滴里面只有1个细胞,一个包含细胞的油滴内就是一个单细胞scRNA-Seq。
每个GEMs内包含独特的10X barcode用于区分不同的单细胞;
每个GEMs内相同的10X barcode与不同的UMI组成用于区分不同转录本的Gel Bead poly(dT) Primers。
V2版本试剂产生的文库结构:
V3版本试剂产生的文库结构:
叁
Adapter and primer sequences
各引物序列总结如下:
Beads-oligo-dT
Template Switching Oligo (TSO)
5'-
cDNA Forward primer
5'-
cDNA Reverse primer
V2: 5'- AAGCAGTGGTATCAACGCAGAGTACAT -3'
V3: 5'- AAGCAGTGGTATCAACGCAGAG -3'
Illumina Truseq Read 1 primer
5'-
Illumina Truseq Read 2 primer
5'-
Truseq adapter (double stranded DNA with a T overhang)
Library PCR primer 1
5'-
Library PCR primer 2
5'-
Sample index sequencing primer
5'-
Illumina P5 adapter
5'-
Illumina P7 adapter
5'-
rGrGrG的作用是:提高结构稳定性,利于TSO引物跟多出来的C结合,文献里也是试了很多种不同的TSO3’端结构和修饰,这个rGrGrG在测试结果表现优良
肆
Step-by-step library generation
V3版本试剂产生的文库结构:
到底是怎样的实验过程使Gel Bead poly(dT) Primers与成熟的mRNA组合形成了这样的文库结构呢?
这一章节我们将Step-by-step 解读文库的产生。
0
Inside individual GEMs
每一个GEMs均是Gel Bead + Master Mix + Cell Lysate的混合
1
mRNA捕获、反转录、末端修饰加Cs
在GEM中Beads-oligo-dT引物参与mRNA的捕获,反转录酶采用MMLV,MMLV的末端转移酶活性在末端加Cs。
2
第二链合成
加入TSO引物,TSO的rGrGrG结合第一链的Cs,以第一链cDNA为模版进行延伸。
扩增后的cDNA大约几百ng,文库片段大小集中在1-2kb:
PS:这里的cDNA是全长的转录本,所以从这一步骤之后,如果能够通过片段筛选+PCR循环数及加入接头的选择控制,可以探讨结合三代测序仪实现单细胞ISO-seq的可能
在GEMs中的过程到这结束了,后续的过程是所有细胞的cDNA混合在一起进行处理。
3
加入引物扩增全长cDNA
加入cDNA Forward 和 Reverse primers扩增全长cDNA
不同的细胞数量扩增的循环数不同,对应列表如下:
一般样品的细胞数量为5000,8000,和10000的居多,所以循环数基本是11或12个
4
cDNA片段化,末端加A
使用Fragmentase实现扩增后cDNA的片段化及末端加A修饰,为后续Illumina Truseq adapter的添加做准备
cDNA文库加入Fragmentase后,有3种产物
Product 1 (TSO plus 5'-end of cDNA)
Product 2 (middle of cDNA)
Product 3 (Illumina Read 1 sequence, cell barcode, UMI plus 3' of cDNA)
这个Product3才是我们后续文库构建需要的产物
5
连接Illunina Truseq引物(Read2)
打断后的cDNA中加入Illumina Trueseq adapter Read2(with a T overhang)进行连接,对应上一步会形成3中产物
Product 1
因为TSO的5' end 是被阻断的,所以adapter 只会和cDNA end相连
Product 2
这一部分产物会因为semi suppressive PCR而不能被有效的扩增??,待确定
这部分Product2是不能长在Illumina的FlowCell上被测到的
Product 3
这部分序列在后续PCR过程能够被指数型扩增
6
加入文库PCR引物进行扩增
上一步连接Read2之后加入P5和P7,加入P5和P7,结合Read1 Read2进行指数扩增放大文库
这一步扩增的循环数与DNA投入量对应关系如下:
7
Final library structure
经过以上步骤就产生了可直接用于Illumina测序仪上机测序的文库
V2 library:
V3 library:
伍
文库测序
Illumina文库测序先测P5端的Read1,再测Sample Index,最后是测P7端的Read2
1
P5端,测Read1
加入Truseq Read 1 primer以底链为模版测Read1,Read1包括16-bp cell barcode 和 10-bp UMI, 26 cycles (V2), 28 cycles (V3)
2
Sample Index
加入Sample Index测序引物对Sample Index进行测序
3
P7端,测Read2
加入Truseq Read 2 primer以底链为模版测Read2,
陆
参考
1. https://teichlab.github.io/scg_lib_structs/data/CG000108_AssayConfiguration_SC3v2.pdf
2. https://teichlab.github.io/scg_lib_structs/data/CG000183_ChromiumSingleCell3__v3_UG_Rev-A.pdf
3. https://teichlab.github.io/scg_lib_structs/data/CG000185_ChromiumSingleCell3__FeatureBarcode_CellSurfaceProtein_Rev_B.pdf
4. https://assets.ctfassets.net/an68im79xiti/5VgAXpSNhFJBN6XYGIQsY1/008faef1ea0df36bc650505b06900d53/CG000201_TechNote_Chromium_Single_Cell_3___v3_Reagent__Workflow___Software_Updates_RevA.pdf
5. https://teichlab.github.io/scg_lib_structs/data/indexed-sequencing-overview-guide-15057455-05.pdf
柒
Special thanks to
徐护朝