查看原文
其他

MBE:你爱吃的核桃是怎么来的?重测序告诉你进化起源 | 群体遗传

靠谱er 联川生物 2022-05-21

核桃可谓是世界上最著名的干果之一,栽培核桃几乎遍布整个北半球。核桃仁长得实在太像大脑,所以各种“核桃仁能补脑”的说法也广泛地流传开来。当然,可以确定的是,核桃仁的确具有很高的营养价值。核桃不仅好吃,还可以榨油,可以入药,用来赏玩(盘他!)也很不错,核桃木还是材料极佳的硬木。由于其极高的应用价值,研究者自然对它的进化历史也十分关心,但是对于栽培核桃(Juglans regia,也称波斯核桃)而言,想要弄清楚它的进化起源却是太难了点。核桃属现存约22个种,分为核桃(Juglans)、黑核桃(Rhysocaryon)和白核桃(Cardiocaryon)三类,黑核桃主要分布于美洲,白核桃主要分布于亚洲却有一个种主要分布于美洲。而介于这两者之间的栽培核桃却广泛分布于欧亚大陆。栽培核桃究竟是怎么进化而来,仍然是一个令人费解的谜团。来自北京师范大学的研究者利用重测序手段,通过巧妙的方案设计破解了栽培核桃的起源之谜,结果于2019年6月发表于《Molecular Biology and Evolution》。

白核桃、栽培核桃和黑核桃

1材料与方法研究者选取了核桃属19个物种的80个个体进行了测序,平均测序深度达到30×。其中6个种来源于北美温带地区,6个来源于中美洲亚热带地区,2个来源于南美洲热带地区,3个来源于亚洲,以及2个广泛分布于欧亚大陆的种(包括栽培核桃)。另外研究者还选取了不属于核桃属但同属胡桃科的枫杨(P. stenoptera)和化香树(Pl.strobilacea)作为外类群。
由于是对不同种的个体进行重测序分析,研究者并没有选取核桃属的任何一个物种作为参考基因组,而是选择了枫杨作为参考基因组,以保证参考基因组与各个个体的遗传距离大致相同。枫杨的基因组使用Hiseq 4000测序仪,构建了不同插入片段的文库测序了共计260×,并且使用allPathsLG软件进行了组装。研究者将重测序reads比对到枫杨基因组上后使用SENTIEON DNAseq packages进行了变异识别以获取SNP数据。SNP数据进行了严格的过滤,去除了2个以上等位基因的位点、包含丢失信息的位点、以及在任意个体中测序深度低于10×或高于60×的位点。在剩余的位点中,测序深度在20×-60×之间的,且非reference等位基因比例为20%-80%,或者测序深度在10×-20×之间,非reference等位基因比例为10%-90%的位点被判定为杂合基因型,否则位点被判定为纯合基因型。之后再按位点间隔 >5 kb以及MAF > 0.05进行过滤。利用这些过滤后的SNP数据,研究者对利用测序数据进行了种群结构(Structure)以及主成分(PCA)分析。不过研究者并没有使用这些数据来进行进化分析,而是采用了不同的策略,将黑核桃、白核桃和核桃三类分别比对到最近的基因组上,属于黑核桃的物种数据比对J. nigra基因组,属于白核桃的物种数据比对J. mandshurica基因组,核桃则比对栽培核桃基因组。从中选取单拷贝基因组的数据进行进化分析,使用RAxML利用最大似然法构建系统发育树,使用PHYLONET计算进化网络,以及使用HyDe软件计算种间的基因流,并使用DIYABC软件分析种群历史模型。2结果与分析测序与变异识别
枫杨的基因组组装得到了671Mb的scaffold,其中548个scaffold长度大于100kb。将80个核桃个体的重测序数据比对到枫杨基因组上,能够覆盖70.6%的枫杨基因组。为了获取可用于后续分析的高可靠性SNP,研究者仅保留了那些位于超过100kb以上scaffold,在所有物种中都能检测到并且含2个等位基因的SNP,而且按照相互距离不低于5kb(最小的连锁不平衡衰减距离)以及MAF>0.05为标准进行筛选,最终保留了19795个SNP。同时,研究者还选取了2901个单拷贝基因的数据用于构建系统发育树。群体结构:栽培核桃的杂交身份在群体结构分析中,从delta K的结果看最合适的K值为3,但研究者同时也展示了K=2和K=4的图,在K=2时,黑核桃和白核桃分别呈现出截然不同的聚类,但是栽培核桃和近源种铁皮核桃(J.sigillata)呈现出混合的聚类情况。K=3时,黑核桃、白核桃、栽培核桃/铁皮核桃分别聚为一类。核桃的群体结构从PCA分析的结果上看,黑核桃、白核桃和栽培核桃/铁皮核桃也分别聚在一起,而且根据研究,杂交种及其亲本进行PCA聚类的时候,杂交种会在PC1介于两亲本之间,且在PC2上与两亲本出现较大差异。从这里看,证实了栽培核桃是黑白核桃的杂交品系。
各类核桃的PCA聚类情况另外,研究者通过系统发育网络的构建,也确认了栽培核桃/铁皮核桃是由黑白核桃杂交而来,不过从系统发育网络的结果来看,黑白核桃分别对栽培核桃遗传物质的贡献比例有所差异。对于栽培核桃来说,有47%的遗传物质来源于黑核桃,53%的遗传物质来源于白核桃。(不过此结果与Structure计算结果有一定差异,后者显示有33%来源于白核桃而67%来源于黑核桃。)
核桃的系统发育网络以及叶绿体进化树
基因流与种群历史判定杂交发生的年代
研究者使用ABBA-BABA检验对栽培核桃、J.nigra(黑核桃)、J.mandshurica(白核桃)之间的基因流,结果显示栽培核桃与黑/白核桃的距离都显著近于黑/白核桃之间的距离,证实了栽培核桃由黑白核桃杂交的起源。同时ABBA-BABA检验还显示存在黑核桃和亚洲白核桃向美洲白核桃(J.cinerea)的基因流。研究者还使用了近似贝叶斯计算(Approximate Bayesian Computation)来计算了杂交种栽培核桃产生的四种可能的机制:杂交起源、谱系融合、由黑核桃导入白核桃群体的基因流以及由白核桃导入黑核桃群体的基因流分别对应的后验概率。其结果显示,栽培核桃这一支极有可能是由谱系融合的方式诞生的,杂交事件发生的时间大约是345万年以前。栽培核桃的四种起源模型及其后验概率
不一样的叶绿体进化树:美洲白核桃的真实身份
研究者在比对核基因系统发育树和叶绿体系统发育树的时候,发现黑核桃、白核桃和栽培核桃的聚类分布情况基本一致,只有美洲白核桃J.cinerea在两者的拓扑结构之间存在较大差异,在叶绿体树中J.cinerea插入到黑核桃的聚类结构中。考虑到除J.cinerea之外的白核桃仅在亚洲分布,黑核桃仅在美洲分布,结合基因流的分析结果以及ABC方法计算得到的美洲白核桃进化历史,研究者最终判断是一支迁移到美洲的亚洲白核桃以花粉覆没的形式将基因渗入到美洲黑核桃中,最后形成了特殊的美洲白核桃J.cinerea。靠谱er点评本研究看似是常规的重测序类型研究,但其实研究者想解决的问题是更深层次的物种形成问题,这势必涉及跨物种的进化分析,给分析思路和方式都带来了很大挑战。本文首先在参考基因组的选择上就考虑到了这一点,选取了不属于核桃属的枫杨来作为重测序比对的reference。并且在随后的SNP过滤过程中,也采用了更严格的标准,以确保可以从数据中得到最可靠的结论。其次,围绕着“栽培核桃是由黑白核桃杂交而成”这一假设,研究者采用多种分析手段对其进行了验证,包括群体结构、基因流、系统发育网络等,而且这些分析的目的都非常明确。这也提示我们,想要做出有亮点的研究,需要首先对想探索的科学问题有一个清楚的把握,然后围绕科学问题展开后续实验和分析,而不是先把所有可能的分析都尝试一遍,后者往往会让研究走更多的弯路。最后,在分析结论与预期不符的时候,例如本研究核基因树与叶绿体树之间存在拓扑结构的明显差异,我们可以先思考出现这种问题的原因,而不是急着对数据和分析方法进行调整,往往能够挖掘到意料之外的亮点。参考文献:Zhang B W, Lin-Lin X, Li N, et al. Phylogenomics reveals an ancient hybrid origin of the Persian walnut[J]. Molecular biology and evolution, 2019.相关阅读


群体知识干货大放送 | 学习专栏

Nat Eco&Evo:稗草重测序揭秘稻田里的“伪装者” | 群体遗传

Genome Biology:大规模桃树重测序带你回溯五千年桃驯化史 | 群体遗传

葡萄美酒夜光杯:GBS-GWAS定位葡萄风味基因 | 群体遗传

吃瓜的正确姿势 : GBS高密度遗传图谱助力甜瓜“好吃”性状QTL定位 | 群体遗传

一个14分的作物基因定位综述引发的吐槽

BSA相关知识——质量、数量性状和作图群体 | BSA专题

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存