百迈客Hi-C助力菠萝基因组再登NG!
2019年9月30日,福建农林大学基因组研究中心明瑞光教授团队联合多个单位共同合作的菠萝研究成果以“The bracteatus pineapple genome and domestication of clonally propagated crops”[1]为题在国际知名期刊Nature Genetics在线发表,这是该团队继2015年首次破译菠萝基因组[2]后在菠萝基因组学领域的再一次突破。
本研究中,作者借助二代Illumina+三代Pacbio及百迈客Hi-C技术获得了菠萝(Ananas comosus var. bracteatus CB5)高质量基因组。文中使用canu进行三代初始组装,得到809.6 Mb的组装序列,其中约300 Mb序列为冗余序列。为了消除冗余序列,文中利用一种基于全基因组比对的新算法来识别和过滤杂合contigs,最终获得了513 MB基因组序列,完整性为92.6%,contig N50为427 Kb,相较于之前发表的菠萝基因组,contig N50 提升约3.4倍。同时,转录本回比基因组显示出了99.92%的序列一致性,二代回比效率为98.47%,覆盖了99.51%的基因组。之后通过Hi-C技术最终将并将456 Mb基因组定位到25条染色体上。整个基因组中共鉴定出了383.2 Mb重复序列,占总基因组的74.7%。借助CB5的高质量组装,研究人员还校正了早先发表的菠萝基因组(F153)1号、24号和25号染色体的搭建错误。
图1 菠萝CB5基因组特征分布
通过比较CB5和F153两个菠萝基因组,研究人员首先分析了菠萝的纤维合成、糖代谢和菠萝蛋白酶相关的基因,发现CB5和F153含有相同的8个CesA基因,其中与初始细胞壁合成相关的CesA基因在CB5和F153中都倾向于高表达,但与次生壁合成相关的基因似乎只在F513中高表达,另外木质素合成相关的基因在CB5和F153中表现出较大的拷贝数和表达差异。花青素合成基因如CHS,CHI,F3H和F3’H在CB5发生了扩张,但缺失了FLS和ANS两个同源基因。尽管CB5与F153拥有相同数量的糖代谢相关基因,但是蔗糖转运蛋白基因(SUTs)在CB5果实成熟期处于低水平表达,当与含糖量高的菠萝品种MD2相比时,这种趋势更加明显。CB5和F153中分别鉴定出了47和61个半胱氨酸蛋白酶类型的菠萝蛋白酶基因(CPs),这些CPs 分属9个亚家族,其中VI亚家族的扩张可能导致了菠萝中较高的菠萝蛋白酶含量。
该研究利用来自不同菠萝品种、野生种及近缘种共89个个体重测序数据分析了栽培菠萝的起源、群体结构以及基因组间的亲缘谱。研究人员首先校正了一些个体的归类,然后明确了广泛栽培的“Singapore Spanish”和“Selangor Green”经由巴西东部扩散到了亚洲。在走出美洲的过程中栽培种群comosus遭受了明显的遗传瓶颈,遗传多样性与野生的microstachys相比降低了15倍以上,同时不同的栽培种群间也发现了基因组互相渗入的现象,强弱程度不一的基因交流映射了菠萝几千年来的栽培历史。研究发现不同的菠萝个体间存在大量的TE插入变异,由于菠萝主要是营养繁殖,其基因组变异主要来自体细胞变异,因此TE诱发的体细胞变异是菠萝新性状产生的重要源动力。无性繁殖过程中体细胞有丝分裂重组会驱动基因组产生大量的纯合区段(runs of homozygosity, ROH),这些ROHs在“Singapore Spanish”中尤为明显,暗示某些ROHs的固定可能是驯化选择的结果。
通过栽培群体与野生群体间的遗传进化分析,研究人员识别出了~11.9Mb的驯化区域,这些区域包含了392个基因,其中3号染色体上一个225kb的区段其序列多样性在栽培群体中出现了将近400倍的下降,注释发现了菠萝蛋白酶抑制子相关的基因(AccBI1 和 AccBI2),基因表达显示这两个基因功能与菠萝果实的成熟软化高度相关。
大部分的栽培菠萝品种属于自交不亲和(self-incompatible,SI),种种迹象表明这可能是驯化选择的结果,为此研究人员分析了25个SI相关的基因,包括S-RNase基因、SLFs/SFBs基因以及F-box基因,最后发现在F153中来自ribonuclease T2的Aco001100和来自F-box成员的Aco00868在2号染色体上紧密关联,且Aco001100与另外两个SLFs/SFBs基因Aco001170 和Aco012216组成了一套典型的基于RNase的SI系统,但是在CB5中只有1个SLFs/SFBs基因CB5.v30013780与Aco001100的同源基因CB5.v30014510紧密关联,导致CB5中缺失有效的SI系统。
图3 菠萝3号染色体与菠萝蛋白酶相关的驯化区
[1] Chen L ,VanBuren R, Paris M., et al. (2019). The bracteatus pineapple genome and domestication of clonally propagated crops. Nature genetics.
百迈客自2016年初以来,利用Hi-C技术进行染色体水平的基因组组装及染色体三维构象的研究,成功开发出六碱基、四碱基酶切方案,组装、互作轻松拿下。在植物Hi-C领域,更是迈进了一大步,在同行还只能处理植物活体样本的时候,我们已经可以轻松“驾驭”离体枝条。迄今为止,保持着近100%的建库成功率,完成近300个物种,近千个文库构建;文库含酶切位点的有效数据比例最高达93%以上,平均比例高达68%。另外百迈客在Hi-C技术方面获得多个专利及软著。目前已有多篇成功案例在线发表,更多Hi-C高分文章已发表路上,后续会陆续与大家见面,敬请期待~~