近日,遗传学大牛George Church、华大Lars再生医学研究所及青欧生命科学高等研究院罗永伦团队在科研预印杂志bioRxiv发表了高通量CRIPSR基因编辑图谱研究成果——TRAP-seq,该技术在细胞内可一次进行上万条gRNA的编辑图谱检测。通过高通量的检测分析,该团队详尽的揭示了SpCas9,ABE,CBE 三种碱基编辑器的基因编辑规律,分析了gRNA序列特征与三种编辑器效率的关系。同时结合自主开发的机器学习算法,训练得到了gRNA效率预测数学模型,并将实测数据整合到数据网站,为领域内科研人员提供了可靠的gRNA设计依据及辅助工具,相关结果预印在bioRxiv上。CRISPR-Cas9系统是细菌和古细菌中的一种免疫系统,由介导DNA识别的CRISPR RNA (crRNA)和介导DNA切割的Cas核酸酶组成。该技术可以设计特异性的向导RNA(sgRNA)引导Cas核酸酶(sgRNA-Cas复合物)实现基因组靶向定位和精准编辑。与其他基因编辑系统相比,CRISPR系统具有使用简单、方便、成本低、可对多个基因打靶的优点,是目前最主要的基因编辑工具。为了揭示SpCas9、ABE及CBE的基因编辑图谱及规律,实现更精准高效的基因编辑,罗永伦团队开发了TRAP-seq技术,其原理为:在gRNA及其scaffold结构后面,加上gRNA在基因组中的靶位点上下游基因序列。合成成千上万条序列,将其包装整合进慢病毒载体,形成CRISPR高通量文库。随后,在相应基因编辑器表达的细胞中,gRNA引导SpCas9或ABE或CBE对TRAP靶位点进行编辑,通过PCR扩增,以及基于DNBSEQ平台的高通量测序,调取含有上百万条编辑特征的TRAP序列,并分析其编辑图谱、基因编辑器的特征及其效率与gRNA序列的关系。
在该研究中,作者采用TRAP-seq的高通量文库检测方法,通过对12000个位点(3832个基因)中SpCas9、ABE、CBE基因编辑后图谱分析,系统的揭示了3种基因编辑器的编辑特点及gRNA序列特征与编辑效率的关系,同时形成了详细的针对人类3800多个基因的gRNA效率数据库。在此基础上,通过GNL-scorer机器学习对实际检测数据的训练和分析,找到了针对不同基因编辑器的gRNA编辑效率的最佳预测模型。这些成果为今后科研人员应用这些基因编辑工具提供了可靠的数据基础。小贴士:TRAP-seq算法特色
高通量测序技术可以快速定量SpCas9在细胞中小片段插入和删除的编辑效率,同时也可以实现对ABE和CBE效率的高通量分析。为了实现对以上结果的快速定量,本文创造性的提出了“分级过滤”和“网格分析”的策略。
12000条gRNA的数量和测序深度为数据的分析带来了严峻的挑战。传统的高通量测序变异分析缺乏精度,而一些CRISPR分析软件例如CRISPResso2不仅定制程度高,分析效率也格外低下。本文结合TRAP文库设计结构,在经过一系列测序质量过滤后添加了第二层过滤(固定的首尾模型和碱基数量)和第三层过滤(去除非编辑的异常突变)。以上的过滤不仅提高了分析的精度,还大大提升了效率。
George Church,美国著名学者,人类遗传学顶级专家,哈佛大学和麻省理工学院教授,美国科学院与美国工程院的双院院士,学术研究与科技创业的双料成功者。Church教授是基因组学和生物技术领域全球知名的科学先驱,累积发表了超过400篇学术论文,并拥有超百项专利。
Xi Xiang向熙中国科学院大学博士,奥胡斯大学博士后在读(右二)
Kunli Qu渠坤丽青欧研究院基因编辑技术负责人(左四)
Xue Liang梁雪青欧研究院单细胞分析负责人(左二)
Xiaoguang Pan潘晓光青欧研究院生信开发负责人(右三)
>>>>原文链接:
https://www.biorxiv.org/content/10.1101/2020.05.20.103614v1