专访清华大学张翀丨单次实验即可大规模筛选全基因组位点,构建百万量级基因型-表型关联数据库,CRISPR能否造就下一个传奇?
1987 年,日本分子生物学家石野良纯发现在大肠杆菌基因组中有一些奇怪的结构重复出现,两两之间被一些杂乱序列分隔。随着更多研究的深入,这些序列被命名为 CRISPR ,并被认为是细菌抵御病毒入侵的免疫系统。
CRISPR 序列可以被转录成 RNA,后者可与 Cas 蛋白结合,与对应的 DNA 分子配对之后,就可以行使 “切割” 功能,基于这一原理,从 2012 年开始,CRISPR 基因编辑技术开始飞速发展。2020 年,Emmanuelle Charpentier 和 Jennifer A. Doudna 也因为 CRISPR-Cas9 技术获得了诺贝尔化学奖。
可以说,基因编辑领域 “王朝” 更替,而此时此刻,CRISPR 风头正盛。
生辉 SynBio 邀请到了清华大学化学工程系张翀副教授,与我们分享 CRISPR 技术在原核微生物中的应用研究。
图丨张翀(来源:受访者)
张翀,清华大学化学工程系长聘副教授,曾荣获国家高层次青年人才、亚洲生物技术青年科学家奖(Young Asian Biotechnologist Prize)、伦世仪发酵工程杰出青年学者奖、中国轻工业联合会技术发明一等奖、日内瓦国际发明博览会金奖等荣誉和奖励。课题组的主要研究方向是微生物智能制造,开展高通量基因型-表型关联原创技术与装备的研究,包括合成生物元件高通量设计与改造、全基因组规模基因及位点功能挖掘、微生物表型高通量测试与筛选装备等。
将 sgRNA 活性与细胞存活率关联
Cas9 是核酸酶的一种,核酸酶就像一把 “剪刀”,可以 “切割” 核酸分子。早在 20 世纪 70 年代,科学家们就在细菌中陆续发现了一些核酸内切酶,而 1978 年的诺贝尔生理学和医学奖也颁给了三位在核酸限制内切酶的发现和应用上作出卓越贡献的学者。
“对比 1978 年和 2020 年的诺奖成果,两者都是核酸内切酶的应用,不同点是 CRISPR-Cas9 系统更为复杂和高级,具有可编程、可追踪的特性,可在更大规模比如基因组水平上进行基因操作。”
正因如此,这一技术也成为了当前研究首选的基因编辑工具,“CRISPR 技术具有良好的宿主普适性,自从 2013 年开始,已经被应用于各类微生物宿主。” 张翀表示,“但在微生物中使用这一技术时,也会遇到一些问题,比如如何设计和选择高活性的 sgRNA?如何处理脱靶效应以及利用错配效应提高 sgRNA 特异性?CRISPR 技术在基因组水平上的操作有何优势?”
张翀告诉生辉 SynBio,sgRNA 的活性预测模型在真核细胞中研究较多,但在原核细胞中的预测模型研究还相对较少。“我们开发了一种利用混合筛选技术研究 sgRNA 的活性与特异性的方法,首先针对大肠杆菌全基因组若干位置设计 sgRNA 文库,对大肠杆菌基因组进行‘切割’,对于原核生物来说,基因组被‘切开’就意味着死亡。”
“最后通过测序获得 sgRNA 的丰度信息,来反应细胞的存活率,细胞存活率越低,说明 sgRNA 活性越高。”
图丨 sgRNA 活性与细胞存活率关联(来源:受访者)
后续的验证实验也证明了利用这一方法筛选出的高活性的 sgRNA 可显著提高基因编辑效率。此外,张翀团队还利用累积的大量数据进行了机器学习,建立了 sgRNA 活性预测模型,可以指导高活性的 sgRNA 的设计,为 CRISPR 技术在原核生物中的应用提供了一个有力工具。
CRISPR-Cas9 技术的缺点之一是脱靶效应,即 Cas9 蛋白会在基因组中的非完美匹配位点切割 DNA 分子,而一些研究表明 sgRNA 的错配有助于减少脱靶效应。
“目前 sgRNA 错配效应研究缺乏细菌活细胞内的实验数据,缺乏定量化的预测模型,导致对内在分子机制的理解不足。” 张翀表示。
图丨错配 sgRNA 结合活性研究(来源:受访者)
同样的,在上述基因和表型相关联的方法论的指导下,研究团队设计了 sgRNA 的错配文库,并在靶标下游设计了 sacB(蔗糖致死基因),在蔗糖的选择性培养条件下,细胞的存活率与 sgRNA 活性有关,后续可以结合核算热力学数据,来预测 sgRNA 错配活性,这是目前唯一一个完全基于核算热力学数据进行 sgRNA 错配活性的预测模型。
CRISPRi-seq 全基因组规模基因型 - 表型关联
在微生物中,基因型和表型通过一个极其复杂的网络相关联,科学家们一直在努力研究其对应关系,最早科学家通过单个基因敲除的方法,建立了一个基因组范围的单敲除文库,但工作量巨大,费时费力。
近年来,科学家也开发了许多基于 CRISPR 原理的新技术,例如 CRISPR 抑制(CRISPRi)技术,CRISPRi 使用的是失活的 Cas9 蛋白(dCas9),dCas9 可以结合 sgRNA 指定的 DNA 位点,但无法对 DNA 进行切割,因此会阻断转录过程,抑制该基因的表达。
张翀告诉生辉 SynBio,在真核生物中基于 RNAi 的类似研究, CRISPRi 混合文库筛选方法也应运而生,而他的团队报道了首个在原核生物中的 CRISPRi-seq 混合文库筛选研究工具,通过大规模并行建库、筛选、测序、分析,“相比之前的方法,CRISPRi-seq 显著提高了研究通量,只需做一次实验就可以同时研究上千个基因和数十个表型的相关性。”
图丨 CRISPRi-seq 全基因组规模基因型 - 表型关联(来源:受访者)
“我们首先研究了必需基因,对比单基因敲除数据库,结果显示 62% 已知必需基因敲低后表现出致死表型,93% 已知必需基因敲低后表现出生长缺陷,证明了这一方法的有效性,而且一次实验获得的结果就能够达到单个基因敲除方法 93% 的准确性。”
此外,研究也发现了一些基因似乎不是 “必需” 的,尽管它们在已知数据库中是必需基因。团队后续在大肠杆菌中的基因敲除验证实验结果表明,这些基因确实是非必需基因。“所以,我们这个方法不光可以进行大规模的筛选,还可以纠正之前数据库中的错误。”
这一方法还可以用于筛选解析代谢网络结构、筛选毒性化合物的耐受性等,需要改变条件的只是压力环境。
张翀团队还将全基因组 sgRNA 文库设计成了一个 Web 应用程序,来帮助更多学者进行大规模文库的设计。
写在最后
“时间回到 50 年前,1972 年 Herbert Boyer 与 Stanley Cohen 共同参加了一个学术会议,Boyer 展示了他对 EcoRI 的研究成果,Cohen 报告了将质粒 DNA 引入大肠杆菌的研究,而后两人一拍即合,重组 DNA 技术就此诞生,开启了现代分子生物学的先河。”
后面的故事也为人熟知,1976 年基因工程技术公司基因泰克成立,1977 年,公司制造出荷尔蒙生长抑制素;1978 年,公司合成了人类胰岛素……
“一个原创的基础技术与应用场景结合,释放出了非常大的潜能,现在来看,CRISPR 可能也会带来一个新的传奇。我们目前将 CRISPR 基因编辑技术与微流控和生物传感技术相结合,针对微生物蛋白表达宿主可以获得百万量级的基因型 - 表型关联大数据,指导设计蛋白质高效生产的‘下一代细胞工厂’,这将成为微生物宿主重回高附加值蛋白生产主战场的重要机遇”。
从一项技术到一个产业也需要多方推动,由国内多所研究机构和企业共同举办的合成生物学竞赛(以下简称 “竞赛”)就是这样一个 “推手”,竞赛汇聚顶级联合发起方,旨在推倒产业与学术之间的 “高墙”,集结代表现在和未来的才智,打造中国合成生物顶级竞赛和创新孵化平台。
张翀也被邀请成为竞赛的评委,他认为,我国合成生物学持续发展和壮大的关键是如何吸引广大有志青年加入到这一极具魅力又竞争力的领域来,合成生物学竞赛为青年学生和创业者提供了重要的展示和交流平台,将成为未来人才培养重要的基地和储备库。
更多专业内容可观看直播回放。↓↓↓
点击关注生辉SynBio,专注于合成生物学科研及产业化的全链条内容和数据品牌↓↓↓
—— 你可能错过的 ——
专访司同丨自动化合成生物技术加速科学研究,「暴力」破解+AI学习,为基础理论的突破积累数据
合成生物学加持,中国超越欧美成生物制氢领域「科研大国」,2050年产业规模有望突破千万美元 | 生辉分析
专访山东大学李盛英丨利用细菌来源P450酶体外模拟肝脏药物代谢过程,可用于新药安全性分析,并已建立合成生物学催化元件综合研发平台