基于扩增子测序的功能基因研究技术(一)——RiboFR-Seq
RiboFR-Seq
RiboFR-Seq (Ribosomal RNA gene flanking region sequencing),核糖体RNA基因临近区域测序,可以同时得到核糖体RNA可变区和与其相邻的蛋白质编码基因。
在宏基因组测序技术中,受限于短读长片段拼接效率及准确性,很难获得功能基因准确的宿主分类学,因而很难确定样本中发挥特定功能的到底是哪些微生物。
RiboFR-Seq通过对核糖体rRNA及其相邻区域的测序,能够准确的鉴定所测得基因的宿主分类学信息,从而一定程度上能够回答样本中何种微生物在干什么的问题。
技术路线
酶切
与普通的宏基因组测序相比,RiboFR-Seq在DNA碎片化的步骤是应用特异的限制性内切酶进行酶切,以保证获得与16S rRNA相邻的DNA片段。
限制性内切酶的选择原则:
超过半数的全长16S rRNA可以被消化;
在全长16S rRNA上只有一个酶切位点,且位于一个可变区的周围;
酶切后可以形成6bp的粘性末端。
通过研究人员与数据库比对和模拟,最终选择EcoRI和AatII两种限制性内切酶。
LD-IPCR
酶切之后的DNA片段经过自身环化后,应用长距离反向PCR (long distance-inverse PCR, LD-IPCR) 对其进行富集。
LD-IPCR所用引物:
16S-EcoRI-515F :CGT GCC AGC MGC CGC GGT AAT ACG
16S-EcoRI-338R :CAC TGC TGC CTC CCG TAG GAG TNT GG
16S-AatII-784F :AGG ATT AGA TAC CCT GGT AGT CCA
16S-AatII-338R :CAC TGC TGC CTC CCG TAG GAG TNT GG
LD-IPCR反应条件:
94℃ 1 min,30 × (98℃ 10 s, 68℃ 10 min),72℃ 10 min。
经过LD-IPCR之后,即得到了一端为16S V4或V6区,另一端为16S V2区,中间为16S临近区域的PCR产物,之后将其碎片化后按照正常的宏基因组测序进行文库构建和上机测序即可。
数据分析
RiboFR-Seq的下机数据首先应用SortMeRNA将数据中的rRNA和non-rRNA序列进行区分,之后分别按照微生物群落扩增子和宏基因组的分析流程进行分析。
RiboFR-Seq解决问题
能够根据拼接后与功能基因相连的16S rRNA的分类学注释,获得功能基因的宿主信息。
根据拼接后rRNA序列在染色体上的未知及其相连区域的差异,计算该细菌中16S rRNA的拷贝数,从而更准确的评价微生物的组成风度。
应用SortMeRNA对PE序列一端为rRNA另一端为non-rRNA的序列分别进行注释,相互验证,得到更准确的分类学注释,同时识别微生物亚种。
与宏转录组相结合,评估不同宿主微生物中功能基因的表达水平,从而更准确的识别发挥特定功能的活性微生物。