查看原文
其他

群体研究基础上的三代选样思路

宋晓娜 诺禾致源科服 2023-02-13
很多研究者可能也有同样的困惑,前期已经开展了很多的群体基础研究,解析了物种的起源进化机制,或者发现了新的驯化位点;可近些年三代技术又这么火,还需要进行补充研究吗?如果要开展三代研究,该怎样选样呢?


下面小编结合最近发表的文献,跟大家来聊聊群体研究基础上的三代选样思路~



思路一


WGS 研究已发现结构变异端倪



如果前期WGS研究中,初步检测到与候选基因或上下游区域相关的结构变异研究,此时开展三代结构变异研究还是很有必要的。内洛尔牛前期WGS研究中,在13号染色体中发现了2个与毛色候选基因ASIP相关的大片段缺失,其中一段1155bp的缺失包含了ASIP转录本1A和1B(命名为ASIP-SV1,如图1),该缺失与黑色毛发显著相关(p = 9.12 × 10-5)。图1 二代短片段 reads 检测到 CHR13 中1155bp缺失[1](3’-RR(蓝绿色)和5’-LL(蓝色)分别代表同一 reads 的双端比对区域)为了进一步验证 ASIP-SV1 结构变异的存在,作者选取了13个与内洛尔牛为同一祖先的婆罗门牛进行了8X低深度 ONT 重测序研究,发现了 ASIP-SV1 缺失是在超过150bp的转座元件插入后引起。但由于测序深度偏低,未能鉴定样本准确的突变型和转座元件插入长度。图2 ONT 发现婆罗门牛 ASIP-SV1 结构变异[1]



思路二


筛选区域或品种代表性个体



多篇研究报道称,结构变异 SV 与 SNP 分布呈现相关性,通过基因组 SNP 研究可以解析部分物种进化的遗传机制[2]。而 SV 可以在更大尺度上改变基因或拷贝数来影响表达水平,可以作为进化育种研究的补充方法。因此,在实际应用中,可以结合上百例二代样本的亚群特征和物种分布情况,挑选10个以上代表性个体进行三代重测序 SV 研究。该思路逐渐成为三代群体研究的主流。
示例一

遗传多样性和群体结构分析发现,198个大豆样本分为了 Primitive,World 和 Japan 三个亚群,Japan 亚群可能有相对长且独立的进化史。结合亚群和地理分布,从中国(Primitive 亚群)和印度、美国(World 亚群)各挑选2个,日本(Japan 亚群)挑选了4个,总共10个大豆样本,进行 10.5-18.1X Pacbio 重测序研究。

 图3 198个大豆进化树和群体结构分析发现分为3个亚群[2]

基于 LD 分析,SV 分布和 SNP 分布整体是呈现正相关,但在 Japan 亚群中个别区域,如3号染色体的10-20Mb和19号染色体的 10-30Mb 区域,显现出高多态性 SV 而较低的 π 值。表明由于 SV 对表型的影响,仅用 SNP 关联表型来分析是不够的。

图4 10个大豆中不同亚群平均 SV 数量和 π 值分布基本呈正相关[2]

深入研究了不同 SV 区域中是否有驯化育种相关的基因,发现了驯化过程中 SV 与 R 基因簇位置存在关联,如3号染色体的 4.5Mb 区域,包含与大豆抗疫霉相关的 CC-NBS–LRR 基因簇。Pacbio 测序检测到了不同拷贝间的两种嵌合序列,包含这两种的大豆种皮颜色为棕色、棕红色或黑色,而仅包含一种的为黄色或绿色。

图5 大豆 CHS 基因嵌合序列和种皮颜色有关[2]
示例二
  

在算法筛选到51个 SV 高多样性样本的基础上,作者额外挑选了49个番茄样本,总共100个样本。选样时结合前期的 SNP 系统发育研究(图6),充分考虑了番茄品种的多样性,涵盖了3个最接近野生亲缘种的品系(SP,CHE 和 GAL),1个早期驯化种的品系(SLC),以及1个经典的现代栽培品系(SLL)。

图6 SNP进化树中挑选100个番茄样本[3]

通过40X ONT 重测序分析,证实大部分变异通过二代测序无法鉴定。野生种相比驯化种的 SV 具有更丰富的多样性,与番茄种质改良过程中遗传变异缺失相一致。构建的 panSV 基因组连同14个新的参考基因组,发现大部分候选 SV 存在于顺式调控区域,其中影响编码序列的 SV 与表达差异显著相关。通过将定量遗传学与基因组编辑相结合,结果展示了改变基因剂量和表达水平的多个 SVs 如何改变水果的风味、大小和产量。



思路三


筛选 SV 差异最大化的个体


  

上述番茄 Cell 文章中,除了结合品系多样化选样,里面还提到了一个结合 SV 差异最大化进行选样的方法。作者采用了 SVCollector 算法,过滤了二代短读长 SV 片段,只保留与基因上下游 5kb 有交叉的 SV 进行评分,分别在 SLL 和 SLC 品系中选择了29个和22个样本。在同区域或同品种样本较多而无法通过传统方法筛选的情况下,算法辅助不失为一个新的选择,为群体 SV 研究提供了新的方向。

由此可见,除了高大上的纯三代群体研究策略,三代+二代策略可以充分利用前期群体研究数据,成为 SNP 研究转入 SV 研究的有效衔接,将成为科研圈的新时尚潮流。


 
心动不如行动,还在等什么。诺禾特地推出了ONT三代变异检测活动,为各位SV升阶研究保驾护航~



写在最后

4月底前申请的《动植物基因组研究前沿与热点》已全部寄出,已申请但未收到的老师同学,辛苦咨询当地客户经理。


参考文献[1] Trigo BB, Utsunomiya ATH, Fortunato AAAD, Milanesi M, et al. Variants at the ASIP locus contribute to coat color darkening in Nellore cattle. Genet Sel Evol. 2021 Apr 28;53(1):40.[2] Kajiya-Kanegae H, Nagasaki H, Kaga A, et al. Whole-genome sequence diversity and association analysis of 198 soybean accessions in mini-core collections. DNA Res. 2021 Jan 19;28(1):dsaa032.[3] Alonge M, Wang X, Benoit M, et al. Major Impacts of Widespread Structural Variation on Gene Expression and Crop Improvement in Tomato. Cell. 2020 Jul 9;182(1):145-161.e23.



重测序研究部    宋晓娜 | 文案图片来源于网络,侵删

往期精彩推荐




 


点击“阅读原文” 查看更多产品与服务 

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存