10年温故知新,水稻多组学研究的过去及未来
关键字:水稻 多组学研究 综述
阅读用时:约6分钟
4月25日,《Nature》发表我国科学家主导完成的3010份水稻基因组变异研究成果,并首次在正文出现汉字(“籼”和“粳”),这次中国农业领域里程碑式研究将为全球农业发展注入宝贵资源和新动力。为了帮助读者了解过去10年水稻的研究进展,分享上海植生所发表在《Molecular Plant》水稻多组学研究的综述,仅供参考,欢迎留言讨论。
图,水稻的多组学研究框架图。基于多组学的方法,测序数据的研究分析,探索分子育种等应用。
1. 随着测序技术日渐成熟,基因组、表观组、代谢组、蛋白组和表型组学等多组学逐渐建立起来。同时,生物信息的发展为研究者分析多组学数据提供了很大的帮助。
在水稻多组学方面,基于广泛的种质资源、测序数据和生物信息分析方法,已经做了一系列资源的积累和奠基工作。例如:
1)国际水稻研究所 (IRRI) 储存了大约110,000种种质资源,是全球最大最丰富的水稻种子库。
2)中国农业科学院与华大基因研究所对3000多个水稻的变体进行了深度测序,通过与“日本晴”这种水稻进行比对,总共识别了1890万个单核苷酸突变及插入和缺失突变。
3)CropDesign (Belgium) 开发了 TraitMill 平台可以测量水稻的生物重量,植物高度、总的种子数目、种子重量、收割系数等。
4)LemnaTec Scanalyzer 3D 可以自动分析植物的表型。
5)华中农业大学以及华中科技大学共同开发了一个高通量水稻表型测定系统 (HRPF),可以自动监测15个重要的植物性状。
2. 水稻生物信息相关据库,已经积累超过30个。
KOME 数据库 (https://dbarchive.biosciencedbc.jp/en/kome/desc.html),包含粳稻日本晴 Nipponbare 的38 000全长的cDNAs;
RICD数据库 (http://202.127.18.221/ricd/),包含籼稻indica的cDNAs;
CREP数据库 (http://crep.ncpgr.cn/crep-cgi/home.pl),包含一系列水稻的基因表达信息。
水稻的其他生物信息相关数据库,整理如下:
图,水稻的生物信息相关数据库
3. 表观遗传是指在核苷酸序列不发生改变的情况下,发生的可遗传的基因表达变化;水稻的平均甲基化水平高于拟南芥。
表观遗传(epigenetics)是指在核苷酸序列不发生改变的情况下,可遗传的基因表达变化,具体的调控方式包括:DNA甲基化、组蛋白修饰、染色质重塑(chromatin remodeling)以及非编码RNA等。
表观遗传调控是生物体调节基因表达及染色体行为的重要机制之一,对基因表达调控、转座子沉默、基因组稳定性以及生物体生长发育有着重要的调控作用。在植物中,表观遗传调控广泛存在,在植物响应外界环境、调控生长发育可塑性等方面发挥着重要作用。
DNA甲基化作为一种高等生物中保守的表观遗传修饰,在抑制转座子的活性、基因表达和稳定基因组方面起作用。在植物中的甲基化分三种类型:CG、CHG、CHH,其中C是加上甲基的胞嘧啶,H是任何除了G之外的核苷酸残基。
水稻的DNA甲基化有如下特征:
1)Rice 基因组的CG、CHG 和 CHH上的平均甲基化水平以及胞嘧啶上总的甲基化水平分别为(44.46%、 20.14%、 4.02%、24.7%),且比拟南芥高。
2)CG and CHG 的甲基化主要发生在异染色质区域,修饰转座子元件及相关基因。然而CHH甲基化主要分布在常染色质区域修饰MITEs转座子元件。
3)CHG and CHH 序列甲基化主要参与抑制功能相关基因的表达。
4)CG 的甲基化水平相对比较稳定在发育过程的不同组织中,但是CHG and CHH 的甲基化水平随着发育会升高。
4. 组蛋白修饰,通过改变染色质结构或者通过招募与其特异性结合的调控因子改变基因转录水平,调控植物的生长发育和环境响应过程。在水稻中,组蛋白修饰的研究主要集中在组蛋白赖氨酸的乙酰化和甲基化上。
1)H3K27ac and H3K9ac 分布比较类似,主要是激活基因表达的组蛋白修饰,主要位于promoter区域,调控基因表达,它俩的同时存在暗示着可能存在协同作用。
2)H4K16ac and H3K23ac 主要位于低表达的基因转录起始位点附近,H4K16ac 主要与染色体的压缩以及致密化相关。
3)H3K4me2/3 的信号与 H3K27ac and H3K9ac 比较类似,主要激活基因表达。
4)H3K27me3 在不同的组织以及种子中变化比较大,主要维持着抑制基因表达的功能。
图,各个组蛋白修饰在水稻基因组中的分布情况,来自Du et al., 2013
5. 除了一级结构的遗传序列信息外,染色质的三维结构对于基因表达、DNA 复制和DNA 损伤修复等均具有重要的调控作用。Hi-C 技术是第一个从 3C 技术发展出的检测染色体结构的技术,可以捕获全基因组范围的染色质相互作用。Liu et al. (2017a) 通过Hi-C技术揭示了水稻染色质三维结构的重要信息。
Hi-C 技术的基本原理是 :将交联的 DNA 片段用一种 DNA 限制性内切酶 (如HindIII) 酶切,然后使用生物素标记的核苷酸修复黏性末端,再使用平端 DNA 连接酶在低浓度下连接带有生物素标记的邻近 DNA 片段,然后利用生物素抗体纯化连接片段,进而进行高通量测序。
Liu et al. (2017a)通过Hi-C技术揭示了水稻染色质三维结构的重要信息:
1)展现出了水稻的高度致密的染色体状态,同时在水稻中识别出了数以千计的拓扑结构域TAD,和从拟南芥中识别出的染色体拓扑结构域具有很大的差别,如下图:
图,来自Liu et al. (2017a)
2)在染色体和局部水平揭示了水稻染色质组织的新结构特征,水稻的TAD的边界与常染色质的表观遗传标记和激活基因表达有关,并且富含植物特异性TCP蛋白可识别的序列基序。
3)同时发现在细胞分裂时期,水稻染色体结构并没有发生改变,而且不同的植物其染色体三维结构具有很大的不同。
6. 相比于人、动物、细菌、真菌等生物,植物中代谢物的种类更多。
植物大约可以产生0.2-1百万个代谢物。基于质谱和核磁共振成像来研究代谢物,使得代谢物的研究可以发展起来。(Gong et al.,2013)代谢物分析找到了接近1000个代谢物。
常用的代谢组学数据库包括:
1)参考谱图数据库,如 MassBank、METLIN、NIST 等;
2)代谢途径数据库,如 KEGG、PlantCyc、MetaCye 等;
3)化合物信息数据库, 如 PubChem、ChemSpider 等;
4)代谢组学实验信息管理型数据库,如 SetupX、Sesame LIMS 等。
将代谢组学跟多种组学系统地结合起来,相互验证,从整体的角度全面理解植物代谢,将是水稻等植物代谢组学发展的方向。
7. 相比于人、动物、细菌、真菌等生物,植物中代谢物的种类更多。水稻的蛋白组学研究主要基于 gel-based 和 gel-free (LC-MS/MS or MudPIT) 方法,以及基于质谱的iTRAQ等。
蛋白质组学研究主要关注于蛋白识别、定量、活性、稳定性、定位和功能,对于研究细胞信号通路具有重要的作用。水稻的蛋白组学研究主要基于 gel-based (1DE, 2DE, and 2DIGE) 和 gel-free (LC-MS/MS or MudPIT) 方法,以及基于质谱的iTRAQ (isobaric tags for relative and absolute quantitation)。
蛋白质磷酸化是主要的一种蛋白质翻译后修饰,其在植物的发育和生长方面起着重要的作用。
1)PhosphoRice 预测蛋白质磷酸化位点的数据库。
2)Oryza PG-DB基于鸟枪法的蛋白质数据库。
3)PRIN预测水稻的蛋白互作数据库。
未来的挑战是:蛋白质组学研究还需要可靠的方法来来优化样本制备,包括组织及蛋白提取等。
8. 基因编辑手段可以为研究水稻新的基因及表型提供帮助。
T-DNA 突变,快速中子突变,以及 CRISPR/Cas9 使基因突变的方法,产生了大量的突变文库可以为以后的功能基因组研究以及发现新的比较好的基因提供了资源。基因编辑技术 CRISPR/Cas9 可以用于 knock out 一些基因,使得水稻基因型有所提高。基因编辑手段可以为研究水稻新的基因及表型提供帮助。
作者总结了一些与水稻表型比较相关的具有代表性的基因及它们的功能。如MOC1 、OsTB1 等与水稻的产量相关,GS3 与水稻的长度及重量相关。
GS2/OsGRF4/GL2 是生长调控因子控制谷物的大小,受 OsmiR396 调控。抵抗病原体感染相关的基因在水稻中非常重要,如果疾病发生,将会导致粮食产量大大下降。例如,Xa1、Xa10 病菌抵抗的相关基因。同时抵抗其它昆虫的相关基因也非常重要,例如 Bph14,抵抗褐飞虱的相关基因。 OsMAPK5 抗压相关的基因,是 MAPK 的压力应答器。过表达转录因子 bZIP, SKIP, and NAC 等能显著增强水稻的抗干旱能力。
9. 水稻研究的最终目标是做分子育种的杂交应用,培育出环保优良的多产的超级水稻品种,对环境适应性良好、高产量、质量好的水稻。选择优良的基因培育出质量高的品种。
这篇综述通过水稻各个组学的研究现状,对这一领域的未来发展方向进行了展望,提出以下几方面值得深入思考和研究的内容,包括:
1)是否可以通过改变表观遗传修饰或者染色体的状态,达到改变水稻相应重要的性状,如何通过基因编辑技术并结合其它组学数据达到改良品种的目的。
2)如何将多种组学系统地结合起来,相互验证,从整体的角度全面理解并挖掘有用的信息是未来的发展方向。
3)水稻研究仍然存在的问题是由于大数据量,多维度信息的整合,目前还存在一定的困难,比较成熟的计算方法,模型还没有,还不能把多组学整合在一起分析。
4)目前的分析软件以及分析方法仍然需要完善,挖掘能够同时完成数据解卷积、定量定性、多样本对齐、统计分析、数据库搜索、以及图形化展示的方法以及软件很重要,将为我们的目标提供基础。
编者按:对于水稻基因组表观遗传方面的研究,转座子元件在其中的调控作用会是一个重点方向。转座元件是指在基因组中能够移动、复制并重新整合到基因组新位点的DNA片段,其研究主要集中于阐释转座元件在宿主中的复制或表观沉默机制,而转座元件的调控功能并未得到全面探讨。
近年来,越来越多的证据表明转座元件可以作为宿主基因组的“控制元件”发挥重要的调控作用。在作物中研究发现,转座元件既可以通过顺式或反式作用方式调控基因表达,也可以诱导表观等位基因的产生,从而促使固着生长的植物更好地适应外界环境的变化。在哺乳动物中已经发现转座子元件在特定的组织下,具有增强子,绝缘子的作用,并可以帮助调控染色体的高维结构。
所以,或者在水稻中研究转座子元件在表观调控方面的作用,如作为增强子调控靶基因的表达,或者调控染色体的三维结构从而达到影响染色体开与关从而影响基因表达的作用,也许是个很好的切入点,或许可以帮助我们更好的理解水稻中的调控网络,为我们筛选出更好的性状基因提供帮助。
注:以上内容素材由基因慧特约作者提供,不代表基因慧观点。如有疏漏之处欢迎留言补充更正。投稿(有偿)邮箱:info@genonet.cn。
参考链接:
1.Li, Y., et al., Rice Functional Genomics Research: Past Decade and Future. Mol Plant, 2018. 11(3): p. 359-380.
2.Liu, C., Cheng, Y.J., Wang, J.W., andWeigel, D. (2017a). Prominent topologically associated domains differentiateglobal chromatin packing in rice from Arabidopsis. Nat. Plants 3:74–748.
3.Helmy, M., Tomita, M., and Ishihama, Y.(2011). OryzaPG-DB: rice proteome database based on shotgun proteogenomics. BMCPlant Biol. 11:63.
4.Gong, L., Chen, W., Gao, Y., Liu, X.,Zhang, H., Xu, C., Yu, S., Zhang, Q., and Luo, J. (2013). Genetic analysis ofthe metabolome exemplified using a rice population. Proc. Natl. Acad. Sci. USA110:20320–20325.
5.Yang, J., Zhao, X., Cheng, K., Du, H.,Ouyang, Y., Chen, J., Qiu, S., Huang, J., Jiang, Y., Jiang, L., et al. (2012).A killer-protector system regulates both hybrid sterility and segregationdistortion in rice. Science 337:1336–1340.
6.Du, Z., Li, H., Wei, Q., Zhao, X., Wang, C.,Zhu, Q., Yi, X., Xu, W., Liu, X.S., Jin, W., et al. (2013). Genome-wideanalysis of histone modifications: H3K4me2, H3K4me3, H3K9ac, and H3K27ac inOryza sativa L. Japonica. Mol. Plant 6:1463–1472.
更多阅读
◆ 树兰医疗 x 基因慧 | 聚50位大咖,创行业首个私董会
▼ 点击“阅读原文”,查看行业地图