查看原文
其他

Adv Sci 综述|范骁辉/王毅团队评述基于CRISPR和单细胞组学的大规模基因筛选技术及其应用

程俊云 岚翰学术快讯
2024-08-27

撰文︱程俊云责编︱方以一王思珍编辑︱杨彬薇

CRISPR基因筛选(genetic screening)技术可实现全基因组水平的功能基因及调控元件靶向鉴定,已被广泛应用于疾病机理诠释、药物靶点筛选、肿瘤微生物耐药和动物遗传育种等研究。传统基因筛选手段大多限于细胞增殖、形态学和流式等细胞群体水平和较为简单的表型[1],其筛选结果具有较低的检出率,缺乏丰富的细胞表型分析而且忽略了细胞间异质性,难以深入分析复杂多维的基因调控机制和遗传扰动的细胞异质性。


近年随着CRISPR基因编辑与单细胞组学技术的发展,单细胞CRISPR基因筛选技术(single-cell CRISPR screening, scCRISPR)通过将CRISPR基因筛选与单细胞测序相结合,在实现规模化基因扰动的同时,还可在单细胞分辨率下提供丰富的表型读出,被认为是解析复杂生物系统基因调控机制的革命性工具。scCRISPR技术凭借先进的单细胞组学平台,在高内涵检测单个细胞的同时可识别出其中的特异性扰动,大幅加速促进了单细胞分辨率的功能基因组学研究。


2022年12月11日,浙江大学药学院范骁辉教授和王毅教授团队在Advanced Science杂志上发表了题为“Massively Parallel CRISPR-Based Genetic Perturbation Screening at Single-Cell Resolution”的综述文章,全面分析了现有scCRISPR方法的技术原理及优缺点,系统介绍了scCRISPR在生物医学领域中的应用。作者首先系统总结和讨论了scCRISPR技术的演化历程,分析了多种单细胞平台和不同CRISPR编辑方法结合的技术基础和实验参数,对比了不同scCRISPR方法的优势与不足,为促进scCRISPR进一步发展提供了技术性见解。论文梳理了scCRISPR高维读出数据的分析流程和算法工具。论文还系统概括了scCRISPR技术如何被广泛应用于遗传调控机制研究、肿瘤生物学、基因型与表型映射和神经发育病理学等研究领域。此外,文章还绘制了现有scCRISPR技术的决策图以帮助研究者针对个性化研究需求选择合适的技术开展实验研究。博士生程俊云和本科生林高乐王添灏为该文章的共同第一作者,范骁辉王毅教授为通讯作者。



一、传统CRISPR基因筛选的不足


传统基因筛选技术通常可归为两类:其一,将靶向不同基因的向导RNA(single guide RNA, sgRNA)混合后以较低的病毒滴度(MOI)传导至细胞中,使每个细胞至多受到1个sgRNA的扰动,经筛选培养后再根据特定表型将细胞富集,混合,裂解,扩增sgRNA,从而鉴定出与群体水平表型(如细胞生存、荧光报告基因表达等)显著相关的基因扰动;其二,将靶向不同基因的sgRNA分别传导至不同组织或细胞样本中,单独筛选培养后,分别进行sgRNA扩增、细胞成像或转录组测序等,从而获得不同基因扰动对细胞形态、基因表达等表型的影响。前者具有实验简便、成本低、基因通量大的优势,但只能在群体平均值水平上表征基因扰动,灵敏性低,且难以研究扰动调控机制,后者的优势是高内涵读出,但是基因扰动通量低。2016年,Perturb-seq首次将CRISPR基因筛选与单细胞RNA-seq巧妙结合,以单细胞转录组为读出同时筛选几十种基因扰动,此后单细胞CRISPR扰动筛选技术(scCRISPR)快速发展,迄今已有30余种scCRISPR技术,涵盖多种基因扰动模式和不同组学模态的读出(图1)。多样化的技术参数设计使这些技术可以满足不同的实验目的、筛选规模和生物模型的研究需求。因此,系统分析不同类别scCRISPR技术的设计原理及其优缺点,并对现有scCRISPR的应用研究进行归纳与讨论,有望促进其在生物医学领域更为广泛的应用及实现新的技术突破。


图1 scCRISPR技术在2016-2022年的发展趋势

(图源:Cheng et al., Adv Sci, 2022)


二、scCRISPR筛选技术的分类与进展


本文全面综述了现有的36种scCRISPR技术(图1,表1)。基于读出类型的不同,scCRISPR技术主要可分为四类:基于RNA-seq的scCRISPR,基于ATAC-seq的scCRISPR,基于蛋白组学的scCRISPR,以及基于成像的scCRISPR。


表1 scCRISPR技术汇总表

(图源:Cheng et al., Adv Sci, 2022)


基于RNA-seq的scCRISPR多使用基于微流控系统的单细胞测序平台如10x Chromium,如最早开发的Perturb-seq、Mosaic-seq等技术,在慢病毒工程质粒的报告基因的下游引入长12~18nt的短DNA序列作为条形码(barcode)使得每种sgRNA的身份信息可以通过RNA测序读取该条形码获知(图2,图3A)。这样的策略使得一次实验可以扰动几十个基因并分别得到扰动后的单细胞转录组数据[2],可以鉴别出受到多个sgRNA扰动的细胞并用于研究基因相互作用。类似的策略还被用在基因敲入筛选(PoKI-seq)以及体内基因筛选(in vivo Perturb-seq)技术中。其中,DoNick-seq被专门设计用于减少CRISPR脱靶效应,CaRPool-seq被开发用于优化基因组合筛选。


图2 基于RNA-seq的scCRISPR技术示意图

(图源:Cheng et al., Adv Sci, 2022)


图3 sgRNA识别的三种策略原理示意图

(图源:Cheng et al., Adv Sci, 2022)


然而,加barcode的策略虽然有将一个载体上的多个sgRNA映射为一个barcode的优势,但在大多时候由于病毒的同源重组和多重检验问题,barcode会降低sgRNA识别的准确性。所以研究者们设计了另两种可以直接捕获sgRNA的方法。在CROP-seq中研究者利用基因工程慢病毒质粒的3’LTR自复制原理,安排sgRNA在报告基因的3’端共转录,形成带poly-A尾的mRNA,可称之为“poly-A策略(polyadenylated sgRNA strategy)(图3B)[3]。CROP-seq避免了barcode的二次映射,简化了实验流程,也提高了基因扰动通量的上限。另一项工作改进了CROP-seq,通过对sgRNA的靶向扩增来提高其识别率。采用这一策略的scCRISPR技术还包括:增强子-基因对的筛选(crisprQTL mapping),原代细胞中的基因筛选(SLICE和i3N),点突变筛选(SNV screening)等技术。


另一重要sgRNA捕获策略是在sgRNA骨架中嵌入捕获序列,从而使用互补的测序接头就可直接测得单细胞中的sgRNA(图3C)[4, 5],最早应用在direct capture Perturb-seq技术中。该策略相对于poly-A策略,最大的优势在于可以在一个基因工程载体质粒中安插多个sgRNA,十分利于基因组合筛选,而poly-A策略由于每个sgRNA连带的报告基因太长而难以容纳在一个质粒中。随后,研究者开发了Direct-seq以克服direct capture Perturb-seq不能兼容除10x以外单细胞平台的缺点。Direct-seq采用短A/G混合DNA序列作为捕获序列,并证明与任何普通转录本测序平台都是兼容的。该策略也广泛用于各种scCRISPR技术中,包括亚基因结构域的研究(sc-Tiling)和转录本剪接研究(transcript splicing screening)等。


基于ATAC-seq的scCRISPR技术包括Perturb-ATAC、Spear-ATAC和CRISPR-sciATAC。Perturb-ATAC由于基于Fluidigm C1系统和Tn5转座子建库,其基因扰动通量和读出信息的信噪比较低。基于10x的Spear-ATAC,依靠PCR接头特异性扩增sgRNA,部分解决了上述问题(图4)。此外,依靠组合索引(combinatorial indexing)与poly-A策略进行单细胞建库的CRISPR-sciATAC技术也可以实现相当的基因扰动通量。


图4 基于ATAC-seq的scCRISPR技术示意图

(图源:Cheng et al., Adv Sci, 2022)


基于蛋白组学技术的scCRISPR主要包括基于飞行时间质谱流式(CyTOF)的Pro-Codes和Perturb-map,以及基于CITE-seq多组学技术的ECCITE-seq和Perturb-CITE-seq。Pro-Codes利用同位素螯合抗体-抗原表位的线性组合,可以实现上百种基因同时扰动,再利用抗原抗体反应可同时定量检测多达40种表面蛋白(图5)。Perturb-map是在Pro-Codes基础上开发出可直接成像的荧光核定位Pro-Codes,可用于扰动细胞的组织学表征,还进一步首次结合了10x Visium空间转录组技术实现了体内基因筛选[6]基于CITE-seq的Perturb-CITE-seq筛选技术可同时监测转录组和表面蛋白组,ECCITE-seq还可同时结合了TCR-seq和cell hashing技术,支持更多模态读出和混样测序[7]。


图5 基于蛋白组学的scCRISPR技术示意图

(图源:Cheng et al., Adv Sci, 2022)


基于成像的scCRISPR可分为基于原位测序(in situ sequencing)、基于原位杂交(in situ hybridization)以及基于物理分离(图6)。前二者的sgRNA标记策略分别类似poly-A策略和barcode策略,因而原位杂交难以避免会造成一定程度上的sgRNA-barcode错配,但是其实验上的简便性使得其基因通量比原位测序高1~2个数量级[8]。基于物理分离的两种方法(Craft-ID和Raft-seq)都基于特殊的微筏和分离装置,但在sgRNA识别上没有使用较先进的策略,导致基因扰动通量不高,尤其是Raft-seq目前只适合单个基因的亚基因分辨率筛选。基于成像的筛选的最大优势是非侵入式的表型检测,因而更有利于表型动态变化过程的监测。


图6 基于成像的scCRISPR技术示意图

(图源:Chenget al., Adv Sci, 2022)


三、scCRISPR的生物医学应用


截至2022年12月,scCRISPR筛选技术被应用于近60项应用型研究,表2系统概括了其中的代表性应用和一些关键实验参数(表2)。


表2 代表性scCRISPR应用研究汇总表

(图源:Cheng et al., Adv Sci, 2022)


scCRISPR在研究基因元件的相互作用方面具有显著优势,如基因-基因互作、增强子-基因关联、转录因子-基因互作、基因-染色质可及性关联、基因-mRNA剪接等(图7a)。在肿瘤研究方面,scCRISPR用于研究耐药机制、肿瘤微环境对肿瘤免疫的影响,鉴定肿瘤形态与生物标志物以及解析肿瘤发展的动态过程等(图7b)。文章还归纳了scCRISPR用于空间表型与基因型的映射研究,包括蛋白质的胞内外转移、器官发育以及蛋白结构域的药物结合能力等(图7c)最后,scCRISPR还用于神经系统生理病理学研究中,一个标志性成果是在小鼠胎仔的多种新皮质细胞中发现了新的可能影响神经系统疾病的基因调节模式[9](图7d)。


图7 scCRISPR生物医学应用

(图源:Cheng et al., Adv Sci, 2022)


四、scCRISPR读出高维数据分析


论文梳理了scCRISPR高维读出数据的一般分析流程,针对不同的单细胞读出数据类型分别描述了对应的数据分析工具和算法。由于CRISPR扰动和单细胞测序或成像所引入的技术噪音给单细胞数据分析和sgRNA的身份识别及扰动效率分析带来了挑战。因此,本文还介绍了包括基于主题模型、正则化线性模型、流行学习和距离等算法如何用于噪声数据和稀疏数据的分析。最后强调这些丰富的单细胞多模态的读出可作为重要数据资源用于基因组关联分析,解析细胞类型特异性的遗传互作(genetic interaction, GI)以及调节子(regulons)预测等研究。


五、scCRISPR技术选择指南用于个性化研究


论文提供了一个scCRISPR技术决策树(图8),以便研究者根据不同研究目的、实验模型和筛选规模并依照一定原则选择合适的scCRISPR技术进行深入了解,为开展筛选实验提供一定的思考。


图8 scCRISPR技术选择树

(图源:Cheng et al., Adv Sci, 2022)


六、总结与展望


文章指出,单细胞CRISPR筛选的优势包括:(1)对单细胞多模态高内涵表型的解析可深入理解遗传扰动及调控机制;(2)单细胞分辨率下鉴定出特异性细胞扰动响应,有利于研究复杂生物系统的扰动行为;(3)实验周期仅取决于实验模型对扰动的敏感性,相较于传统基因筛选,周期较短;(4)减少了传统基因筛选的批次效应和重复的实验操作;(5)验证基因筛选结果具有高信赖度;(6)研究基因相互作用、合成效应或上位效应较为便利。但是也存在如下缺点:(a)复杂、昂贵的单细胞实验一定程度会限制部分scCRISPR技术更广泛的应用;(b)受限于单细胞可制备的数量,每个sgRNA的覆盖度较低,会造成sgRNA效应变化且读出数据信噪比低;(c)单细胞扰动筛选样本的处理过程较为困难;(d)高维、稀疏的单细胞各模态数据对研究者的分析能力具有一定的挑战。


scCRISPR筛选技术的发展方向包括:(1)开发具有新编辑模式的CRISPR编辑系统、编辑酶等,降低脱靶效应,扩大应用范围;(2)开发或结合更稳定、细胞通量更高的单细胞平台;(3)开发与CRISPR编辑兼容度更高的高分辨率空间组学筛选平台;(4)扩展单细胞CRISPR筛选的组学读出类型,如小分子代谢组学;(5)结合新型递送系统,开发更广谱的体内CRISPR筛选方法和从受精卵开始的de novo扰动方法等;(6)开发灵活的计算工具或管道,综合sgRNA设计及扰动组学数据分析。



原文链接https://doi.org/10.1002/advs.202204484


通讯作者:范骁辉(右一),王毅(右二);第一作者:程俊云(左一),林高乐(左二),王添灏(左三)

(照片提供自:浙江大学药学院范骁辉&王毅团队)


通讯作者简介(上下滑动阅读)

范骁辉,浙江大学药学院教授、博导,浙江大学求是特聘教授、国家重大人才工程特聘教授。现任浙江大学长三角智慧绿洲创新中心主任(兼未来健康实验室负责人),兼任现代中药省部共建协同创新中心副主任、国家药典委员会委员、阿里巴巴-浙江大学智能药学联合实验室主任等。研究兴趣包括单细胞时空转录组方法开发及应用、中药系统生物学等。先后主持“重大新药创制”国家科技重大专项、澳大利亚NHMRC ideas grant、国家自然科学基金等课题20余项,以第一或通讯在Nature  CommunicationsTrends in BiotechnologyNucleic Acids ResearchAdvanced Science 等发表SCI收录论文100 余篇,授权发明专利和软件著作权40 余件。成果获国家科学技术进步一等奖2 项(排名3/15、5/15)。


王毅,浙江大学药学院教授,博士生导师,兼任教育部药学类教指委制药工程专业分委会委员、中华中医药学会中医药信息学分会副秘书长、浙江省药学会理事及中药与天然药物专委会副主任委员。本科毕业于浙江大学制药工程专业,博士毕业于浙江大学药物分析学专业,获全国优秀博士学位论文提名奖及浙江省优秀博士论文。先后在FDA国立毒理研究中心、哈佛大学医学院从事访问研究,主要开展药物组合物筛选、中药药效物质及现代中药设计方法学研究。在Adv. Sci., Anal. Chem., Pharmacol. Res., Chem. Comm.等杂志发表SCI收录论文70余篇。先后承担国家重点研发计划课题、国家科技重大专项子课题、国家973计划子课题、国家自然科学基金等国家级课题10余项,获国家科技进步一等奖1项,省部级科技进步奖励5项,授权发明专利22项,计算机软件著作权2项,获国家优秀青年科学基金、浙江省杰出青年科学基金资助,入选浙江省“151”人才计划。




欢迎扫码加入岚翰生命科学:文献学习2

群备注格式:姓名-单位-研究领域-学位/职称/称号/职位

往期文章精选【1】PLoS NTD|陈晓光团队等揭示媒介蚊虫的交配节律及调控机制【2】Front Immunol 综述︱张翱团队总结STING信号通路在新冠中的作用及研究进展【3】eLife|程博团队揭示转录因子GDOWN1通过核质转位调控全局转录及细胞应激的分子机制【4】Curr Biol|德国马普所(Tübingen)首次证明捕食性线虫的摄食结构由几丁质组成【5】NAR︱武汉病毒所龚鹏团队揭示病毒RdRP核苷酸催化循环新机制【6】Diabetes︱约翰斯霍普金斯大学Dax Fu课题组为体内成像和糖尿病治疗提供新工具【7】Cell Death Discov︱胡越/陈伟团队揭秘脂肪源性间充质干细胞治疗急性肺损伤的新机制【8】专家点评 EMBO Reports︱史庆华团队发现M1AP调控雄性减数分裂重组的分子机制【9】EMBO J︱何凯雯课题组发现皮层中小清蛋白阳性PV神经元功能受时间和睡眠调控【10】Cell Death Discov︱吉训明团队揭示慢性低氧是诱导α-突触核蛋白病理的新机制优质科研培训课程推荐【1】第五届任务态磁共振数据处理学习班(训练营:2022.12.2~12.24)欢迎加入“岚翰生命科学” ”岚翰生命科学“ 诚聘副主编/编辑/运营岗位 (在线办公)

参考文献(上下滑动阅读)

[1] Laralynne Przybyla and Luke A. Gilbert. A new era in functional genomics screens. Nature Reviews Genetics. 2022;23:89-103.

[2] Britt Adamson, Thomas M. Norman, Marco Jost, et al. A multiplexed single-cell CRISPR screening platform enables systematic dissection of the unfolded protein response. Cell. 2016;167:1867-1882.

[3] Paul Datlinger, Andre Rendeiro, Christian Schmidl, et al. Pooled CRISPR screening with single-cell transcriptome readout. Nature Methods. 2017;14:297-306.

[4] Joseph M. Replogle, Thomas M. Norman, Albert Xu, et al. Combinatorial single-cell CRISPR screens by direct guide RNA capture and targeted sequencing. Nature Biotechnology. 2020;38:954-961.

[5] Qingkai Song, Ke Ni, Min Liu, et al. Direct-seq: programmed gRNA scaffold for streamlined scRNA-seq in CRISPR screen. Genome Biology. 2020;21:136.

[6] Maxime Dhainaut, Samuel A. Rose, Guray Akturk, et al. Spatial CRISPR genomics identifies regulators of the tumor microenvironment. Cell. 2022;185:1223-1239.

[7] Eleni P. Mimitou, Anthony Cheng, Antonino Montalbano, et al. Nature Methods. 2019;16:409-412.

[8] Chong Wang, Tian Lu, George Emanuel, et al. Imaging-based pooled CRISPR screening reveals regulators of lncRNA localization. PNAS. 2019;116:10842-10851.

[9] Xin Kin, Sean K. Simmons, Amy Guo, et al. In vivo Perturb-seq reveals neuronal and glial abnormalities associated with autism risk genes. Science. 2020;370:1057.


本文完
继续滑动看下一个
岚翰学术快讯
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存