植物基因克隆发Nature的秘密全在这里了 | 群体遗传专题
近几年农口植物研究领域,国人在CNS正刊上屡有斩获,笔者梳理的文献如下表所示。这些文章聚焦在基因定位和克隆领域,研究物种多为重要农作物。基因定位和克隆算是经典的研究方向了,每年仅水稻的此类研究文献都有大几十篇,以发表P系列(Plant Jounal,Plant Biotechnology Journal,Plant Cell等)杂志最为常见。那么下表中的研究为什么能发到正刊上呢?笔者就以储成才团队1月7日在Nature发表的题为“Genomic basis of geographical adaptation to soil nitrogen in rice”的研究论文为例,尝试解读下发表Nature的奥秘。
Genomic basis of geographical adaptation to soil nitrogen in rice
水稻耐低氮基因克隆和功能验证
发表期刊:Nature
发表时间:2021
影响因子:42.779
氮肥的使用极大地提升了作物的产量,尤其是伴随着第一次“绿色革命”矮杆基因的发现。但是过量的施用氮肥也带来了不可忽视的土壤酸化和水体富营养化的问题。提升作物氮肥的利用率能平衡产量和氮肥施用。然而最近几十年来,作物的育种目标一直集中在高氮肥施用条件下的高产上,可能导致的结果是新培育的品种普遍都氮肥利用率低。大田的管理能提升氮肥的利用率,但是从培育高氮素利用率品种角度切入更适用。亚洲栽培稻遗传多样性广泛,不同生态区也有大量的地方栽培。这些材料包含了大量的适应当地环境(包括土壤肥力)的遗传变异,是优良的遗传育种资源。目前水稻中有几个氮素利用效率的基因被克隆(NRT1.1B,OsNR2),但是在更广泛的群体范围内,氮素利用的遗传基础并没有被全面的揭示。本文就利用水稻的核心种质进行GWAS分析,鉴定到OsTCP19一个启动子区域的突变和氮素响应的水稻分蘖表型关联。该基因的等位基因和不同地理区域的土壤氮素含量相关。下面笔者就详细解读下本文的材料方法和研究逻辑。
1. 基因定位材料
GWAS:110个微核心种质(Rice Mini-Core Collection),基本为地方种,来自于52个国家,覆盖了所有水稻的亚群(subgroup),20个热带粳,10个温带粳,28个Aus型,30个籼稻,3个香米和19个混合型(admixed accessions)。
温馨提示:本文的GWAS材料数量偏少,一般情况下GWAS需要200个个体以上,但是由于本文的材料大多数为地方种,连锁不平衡(LD)衰减程度远高于栽培种,所以定位的分辨率没问题,但是如果是微效位点的性状的话,可能关联位点的显著性就不太高了。
表型鉴定成熟期的分蘖数,每穗粒数,千粒重。分蘖氮素响应值(tillering response to nitrogen,TRN)=((moderate nitrogen-low nitrogen)/low nitrogen)。分蘖氮素响应值最高,作为GWAS的表型值。
2. 验证材料
基因功能验证材料采用中花11号背景(T-cr敲除突变体,各种目标转基因材料)。
3. 克隆基因的育种应用潜力材料
采用包含优良目标基因等位基因的轮回亲本材料粳稻越光(Koshihikari)构建近等基因系NILOsTCP19-H。OsTCP19-H为氮高效利用等位基因。以该近等基因系为供体亲本,秀水134和空育131为轮回亲本继续构建近等基因系KY131OsTCP19-H和XS134OsTCP19-H 。
4. 表型鉴定方法
水稻的水培实验用于基因表达和原生质体准备。共有200株水稻苗,培养液为正常氮素的750 ml Kimura B营养液。营养液每天更换,置于人工培养箱中。设置了6种不同梯度的氮素浓度,其中0.15mM 硝酸铵为低浓度,1.25mM的硝酸铵为中等浓度。
水稻核心种质的栽培:水稻种子在育苗盘中育苗30天,然后移栽到大田,每个材料间距20 cm,种植3行,每行8株。种植地为华南农业大学实验基地。
克隆基因的育种应用潜力材料:越光,近等基因系,中花11和cTO材料种植于北京,育苗移栽同以上,种植间距20cm,每个材料种10行,每行8单株。设置4个重复,高氮素和低氮素两种环境。
低氮素分蘖响应材料(low tillering response to nitrogen,low-TRN),高氮素分蘖响应材料(high tillering response to nitrogen,high-TRN),空育131和其背景的渗入系,秀水134和其渗入系大田实验在海南陵水实验基地进行,设置低氮和中等氮素两种处理,栽培条件和以上类似。
以上大田实验氮肥采用尿素,在苗期,分蘖期和抽穗期施用。50kg/ha为低氮处理,150kg/ha为中等氮素处理,300kg/ha为高氮处理。氮素利用率为土壤中单位速效氮的水稻籽粒产量。
中花11和转基因植株种植于温室中,苗移植于塑料盘中,0.5kg/m2和1.5kg/m2分别作为低氮和中等氮素处理。
5. GWAS分析方法
基于已经发表的重测序获得的SNP数据,依据MAF<5%过滤,保留1,889,946个SNPs作为GWAS的输入基因型文件。GWAS分析模型为GEMMA。PCA采用ngsTools包中的ngsCovar模块分析。PCA的前4个主成分作为协变量控制核心种质的群体结构。阈值采用Bonferroni校正。基于候选基因OsTCP19的关联分析,作者开发了35个PCR标记,MAF≥5%的标记被保留,最终有7个标记和表型显著关联。
OsTCP19启动子区域单倍型分析
候选基因为OsTCP19,下载其启动区域2.5Kb范围的数据(3K水稻计划),由于数据有1.9%的缺失,作者又采用Beagle进行imputation,删除MAF≥1%的SNP,剩余79个高质量SNPs,被分成174个单倍型。低频率的单倍型被认为是基因型错误引起的,过滤完之后剩余20个高置信度的单倍型。
野生稻中OsTCP19基因的等位基因分析
依据已经报道的446个普通野生稻数据(其中11个缺失率高于80%的accessions去除),作者发现5个SNPs和OsTCP19紧密连锁。这5个SNP用来评估该基因的单倍型。
6. 水稻品种的地理分布和土壤氮素含量分析
以水稻3K基因组计划中水稻的6个亚群和起源信息为基础。选择1764个地理信息准确的籼稻品种,OsTCP19基因的等位基因频率在某个国家或者地区数量大于3的被保留,然后计算OsTCP19基因的等位基因频率与土壤氮素含量的皮尔逊相关系数。
为了分析42个国家/地区水稻种植区的土壤氮素含量,作者首先以5'×5'的空间分辨率从全球土壤数据集中收集土壤氮含量数据。通过加权四个土层(0–4.5 cm,4.5–9.1 cm,9.1–16.6 cm和16.6–28.9 cm)的深度来获得平均土壤氮含量。然后从全球环境历史数据库(HYDE 3.2.1)获得最近几十年的水稻种植面积,其空间分辨率与全球土壤数据集相同。从气候研究部门(CRU TS v.3.23)收集了包括年均温度和降水(1990年至2014年)在内的气候数据。这些气候数据是在水稻种植地区提取的,然后取平均值为42个国家或地区的数值。
其他的基因分子克隆和功能验证实验比如亚细胞定位、原生质体荧光素酶、酵母双杂等实验细节笔者在这里就不介绍了,感兴趣读者可以阅读原文。
1. 表型的探索
产量是衡量氮素利用率的最常用指标。水稻的分蘖数,每穗粒数和粒重是产量构成的直接因子。为了进一步细分产量表型,作者评估了三个不同的氮素处理梯度(高氮,中氮,低氮)下的表型,发现分蘖数量在所有的参试材料中均与氮素从低到中增加呈显著正相关,但是氮素从中到高时差异表型并不明显。每穗粒数和千粒重却随着氮素的升高而降低。为了发现更合适的表型,作者计算了氮素响应值((moderate nitrogen–low nitrogen)/low nitrogen),发现分蘖氮素响应(TRN)最明显,且不同材料之间的变异最大,暗示该指标是一个理想的衡量氮素利用率的表型。下文的GWAS分析表型就用这个了。
2. 全基因组关联分析
利用混合线性模型进行GWAS分析,在水稻的第6号染色体上定位到了一个最显著关联的SNP位点,该位点能解释20%的表型变异。连锁不平衡分析发现该位点位于一个20Kb的block中,该block中有3个注释的基因(LOC_Os06g12210, LOC_Os06g12220 and LOC_Os06g12230)。为了获得置信度更高的位点,作者用更严格的阈值,发现一个SNP位于LOC_Os06g12210附近,2个SNPs位于LOC_Os06g12220附近,12个SNPs位于LOC_Os06g12230(OsTCP19)附近。由于这些位点与氮素响应相关,作者又调查了这3个基因的表达情况,发现只有LOC_Os06g12230在根部的表达明显受氮素的抑制,且与铵盐相比,该基因的表达跟硝酸盐更相关。此外,高TRN材料中OsTCP19在根中的表达强烈的低于低TRN材料,这个趋势和TRN的值一致。因此作者推断OsTCP19是TRN表型的casual基因。以上的3个候选基因在高TRN和低TRN材料中茎基部表达差异均不明显,暗示有可能有移动的信号在根系和茎基部之间传导。
为了解决低深度测序带来的未检出变异的问题,作者对OsTCP19基因和promoter区进行了重新测序,发现了一些新的和TRN关联的位点。包括promoter区的一个InDel突变和4个SNPs;编码区的一个SNP和一个InDel。
至此基因定位和候选基因的筛选部分结束,下文就是基因的机制研究。
3. OsTCP119基因的功能
OsTCP19编码一个植物特异的转录因子,隶属于TCP基因家族。该基因主要定位于细胞核中,在根系和茎基部高表达。中花11中过表达该基因(自身启动子和CaMV35S启动子)均表现出分蘖数显著降低的表型,而RNAi的转基因植株则表现出分蘖数显著增加的表型。CRISPR敲除突变体也产生了分蘖数增多的表型。这些结果表明OsTCP19是水稻分蘖数的负调控因子。
OsTCP119基因被证明是有功能的,但是该基因的promoter区和基因区存在较多的变异,那到底是哪个变异才是导致表型差异的causal变异呢?单倍型分析将该基因等位变异分成2种单倍型,即高TRN型(OsTCP19-H)和低TRN型(OsTCP19-L)。110个水稻微核心种质中,几乎所有的aus型为OsTCP19-H型,几乎所有的粳稻为OsTCP19-L型,籼稻中大部分(76.7%)也为OsTCP19-L型。构建的OsTCP19-H型等基因系(OsTCP19-H来源于Kasa,背景为粳稻越光)表现出高于越光的TRN值和低的OsTCP19表达。氮素处理下,OsTCP19-H的启动子活性显著降低,和OsTCP19-H基因的强烈下降趋势一致。为了精准判定功能突变,作者分别引入了五个OsTCP19-H promoter区的突变到OsTCP19-L型的promoter区。发现携带29bp InDel的突变能显著增强OsTCP19-L基因的表达活性,甚至与OsTCP19-H的表达活性相当。其他位点的突变并未引起OsTCP19-L活性的改变。在中花11中,作者特异性地删除了该 29bp位点,结果发现OsTCP19基因表达被抑制,TRN更高。这些结果表明promoter区的29bp的InDel是causal突变。
4. OsTCP19基因的上下游调控
作者在29bp的侧翼鉴定到了2个LBD蛋白结合位点,然后又依据已经发表的文献拟南芥中的LBD蛋白鉴定到了水稻的的2个氮素诱导的LBD蛋白,继续转基因验证了LBD蛋白对该29bp InDel的调控(上游)。
对中花11野生型和OsTCP19过表达植株进行转录组测序,鉴定到2993个差异表达基因(DEGs),822个和发育进程(development-related processes)有关,经TCP结合顺式作用筛选到304个DEGs是OsTCP19的潜在靶基因。由于OsTCP19受氮素调控,它的靶基因应该也受和OsTCP19基因相关的氮素调控。作者基于氮素处理的转录组测序数据分析生成了一个OsTCP19相关的氮素响应基因集。与以上的304个基因取交集后发现15个潜在的靶基因,这其中有一个基因DLT,该基因已经被证明通过油菜素内脂信号途径促进水稻分蘖。DLT在OsTCP19过表达植株中被强烈抑制,但是在OsTCP19敲除突变体中上调。酵母单杂实验和LUC实验表明OsTCP19能和DLT的promoter区直接结合并抑制其活性。ChIP–qPCR实验表明OsTCP19-H和OsTCP19-L显著富集在DLT的promoter区。EMSA实验证明OsTCP19-H和OsTCP19-L能显著降低DLT promoter的迁移速率。
DLT的组织表达模式和OsTCP19类似,但是相反的氮素响应表达模式。除了低的分蘖之外,OsTCP19过表达植株也表现出典型的油菜素内脂缺失表型,包括株高降低、直立以及深绿的叶片、穗长变短,对油菜素内脂敏感性降低,和dlt突变体的表型绝类。此外,过表达DLT能恢复因过表达OsTCP19导致植株分蘖数降低的表型。这些结果表明OsTCP19能直接结合在靶基因DLT上,并提出OsTCP19-DLT基因调控分蘖生长的module。
5. OsTCP19等位基因的地理分布
正如以上结果所呈现的,110个水稻微核心种质单倍型分析发现OsTCP19-L型集中在粳稻和籼稻中,而OsTCP19-H型集中在aus和香稻中。3K水稻计划中的3024个水稻accessions又鉴定到20个高置信度的单倍型,其中12个归属于OsTCP19-H型,剩余的8个归属于OsTCP19-L型。3K水稻计划中OsTCP19-H型等位基因在aus中占比94%,香稻中占比93.8%,粳稻中占比仅4.9%。在III型籼稻中占比68.7%,II型籼稻中占比29.5%,I型中仅占比7.3%。这些结果提示我们不同水稻亚群中OsTCP19的等位基因分布和起对环境的适应性有关,尤其是不同地理位置的土壤氮素含量。收集42个国家和地区的土壤氮素含量之后,我们发现OsTCP19-H型等位基因频率和土壤氮素含量有极强的关联。氮素贫瘠的地方集中在恒河流域的印度东北部和孟加拉国,这些地区主要栽培OsTCP19-H型aus稻。而在一些氮素富饶的地方,比如中国东北部,朝鲜和日本,几乎不存在OsTCP19-H型。OsTCP19-H基因频率和土壤氮素含量之间存在极显著的负相关。这些结果表明OsTCP19-H型等位基因参与了水稻对氮素贫瘠土壤环境的适应性,并在驯化过程中得到了保留。
最后渗入系的品比实验证明OsTCP19-H型等位基因能提升氮素的利用率,对培育环境友好型水稻新品种具有重大实用价值。
1. 关于表型:环境适应性表型或者胁迫类表型往往是非常复杂的复合表型,与多种表型均存在相关性,筛选到一个合适的表型作为抓手非常重要。本文首先将氮素响应的经典表型产量做了分解,然而分解后的表型可能并未关联到令人满意的结果,作者又做了探索(这个过程可能比较难受),终于找到了一个复合型的表型:分蘖氮素响应值(tillering response to nitrogen,TRN)=((moderate nitrogen-low nitrogen)/low nitrogen),该表型在不同材料中的变异大,分辨率更高,最重要的是GWAS得到了极显著关联的位点。表型部分就是需要不断的尝试,筛选到一个合适的表型就成功了一小半了。
2. 关于基因定位:本文的基因定位设计简单,甚至略显单薄,仅仅用110个水稻的微核心种质进行GWAS,正常情况下,GWAS+QTL定位是此类文章的标准配置,甚至会用两个以上的群体进行定位结果的交叉验证。本文定位的结果能被认可的原因,笔者认为有以下几点:首先作者的表型鉴定工作量较大,表型鉴定的体系也完整,侧面上有利于提升定位的可靠性;其次是作者也构建了NIL系,并有预期的表型,效果也类似于图位克隆;最后就是分子功能验证表型也明显。以上三点使GWAS的定位结果更加solid。
3. 关于机制研究:OsTCP19基因的功能验证和机制的研究相对中规中矩,最大的特色在于探索了OsTCP19的上游互作蛋白,同时又筛选到下游的互作基因DLT并进行了验证,打通了油菜素内脂调控的水稻分蘖分子机制的任督二脉。
4. 基因育种应用潜力:通过不同单倍型和大量的土壤氮含量的相关性,发现籼稻、粳稻以及不同地域特异的单倍型,并通过构建高氮地区推广品种OsTCP19-H型单倍型,并进行了三年的小区品比实验,证明了该基因在改良当前水稻主栽品种低氮环境适应的巨大潜力。这一点是本文的最大的亮点之一,也是目前绝大多数基因定位和克隆文章都缺少的内容。
本文立意高远,定位到的基因OsTCP19具有改变全球水稻种植格局的潜力。这一点与上文表格中水稻的耐冷基因定位克隆,水稻的抗稻瘟病基因定位和克隆,玉米叶片夹角的基因定位与克隆以及小麦的抗赤霉病基因的定位与克隆有相通之处。这些重要基因基本上来源于远缘种、野生或者地方种,而且有些基因并未在主栽品种中利用,在应用层面具有广阔的想象空间。所以到这里大家应该明白了选择什么样的材料、做什么样的实验才能发Nature了吧?
点击下方图片进入OmicStudio资料汇总(整合了B站和公众号中的精品资源,及时更新,永久有效)
云平台网址:https://www.omicstudio.cn
云平台特点:
免费免费免费
所见即所得
生信人员直接开发
可下载PPT格式
绘图带数据处理功能
分析参数多样(结合多年售后经验提供)
一键分析
联川生物云平台OmicStudio至今已帮助28000+科研伙伴处理各类组学数据,点击量累计超77000+。目前提供多种云工具、生信分析流程以及各种干货资料和用户文章,已被Theranostics,Bioresource Technology Reports等杂志的多篇文章引用。
Nature Genetics|从GWAS结果里挖掘候选基因方法|群体遗传专题