基因组&单细胞转录组测序揭示了蚯蚓潜在的细胞再生机制 | 单细胞专题
论文标题:Genome and single-cell RNA-sequencing of the earthworm Eisenia andrei identifies cellular mechanisms underlying regeneration
刊登日期:2020年05月
发表杂志:Nature Communications
影响因子:17.694
研究机构:中国农业科学院&昆明动物所
技术手段:基因组测序、转录组测序、scRNA-seq
文章架构
主要研究内容
图1 组装蚯蚓基因组
基于PacBio RS平台对蚯蚓基因组进行测序,最终组装的基因组大小约为1.3Gb,相比于其他几种再生能力强的无脊椎动物基因组具有更好的连续性。利用PE150获得短reads,基因组单碱基的准确性提高到99.97%以上。将短reads映射到基因组上,蚯蚓基因组具有很高的杂合子率(每100个碱基对中有1.5个杂合子位点)。通过分层聚类对2970 countings锚定并定向为11个染色体上(图1)。为评估基因组组装的完整性,作者将短读和转录组unigenes与基因组进行比对,发现超过98.2%的短读和约为94.5%的新生转录组unigenes可以映射到组装上,我们还测试了978个保守的BUSCO基因的存在,发现92.1%的BUSCO同源基因在装配中被完全捕获。以上结果说明该研究基因组的组装具有较高的完整性和准确性。
图2 再生过程中的表型和转录组分析
对蚯蚓在同一部位进行切断后,观察不同时间点表型变化,在24h细胞增殖出现,48和72h增殖细胞显著增加,逐步迁移到横截面中心(图2a-d)。另外,截断后6-7天胚基持续生长,在14天没有观察到新产生的体段,但长出的基部已经积累了色素。在切断后18-28天,新体段出现且再生附件中形成明显的体段。
为探究蚯蚓早期再生过程的遗传调控机制,作者对再生过程中6个时间点(切割后0、6、12、24、48和72小时)的头部的进行转录组测序(图2a),共鉴定6048个共有差异基因,且这些基因的表达谱呈现出时间顺序表达。GO富集分析显示所有再生阶段涉及发育重要的生物学过程显著上调(基因转录、Wnt信号通路、细胞表面受体信号通路和解剖结构发育等),表明再生涉及多个基因和途径(图2e-f)。
图3 LINE2转座元件与蚯蚓再生有关
在蚯蚓中转座子(TEs)约占基因组的56.72%,DNA转座子和长穿插核元件(LINEs)构成大部分重复序列。蚯蚓基因组中大约43.54%的LINE2元件位于内含子区域,6.66%位于基因的5-kb侧翼区域内(图3d)。蚯蚓基因组中重复序列LINE2转座元件,显著高比例地插入到蚯蚓早期再生相关的差异基因,同时某些差异表达的LINE2元件和它们的邻近基因拥有极为相似的表达模式,因此LINE2转座元件可能在蚯蚓再生中扮演着重要的调控角色(图3e-g)。
基因家族的扩张或收缩与特定表型和生理功能的进化有关。在蚯蚓中显著扩增的186个基因家族中,有35个基因家族中超过10%的家族成员在再生过程中出现显著表达变化(图4c),发现ZNFX1、EGFR、NNP、HELZ2和SACS五个基因家族的差异表达基因比例显著高于对照组。已有研究表明,在一些高度再生物种的再生过程中,EGR1是一个核心调控者,该研究发现EGR1不仅在蚯蚓再生过程中发生差异高表达,而且其侧翼的LINE2元件也发生显著差异表达上调。此外,扩张基因家族主要富集在发育生物学通路,而发育和再生在某些通路往往是共通的。一些应激早期基因在蚯蚓和涡虫早期再生中共同激活,暗示蚯蚓和涡虫在早期再生应激反应中可能具有共享的作用机制。在涡虫体内,EGFR-1和EGFR-3的沉默会导致再生过程中形态发生异常和发育结构紊乱,在蚯蚓体内EGFR的拷贝数显著增加(图4d-e)。进一步发现4个与早期再生显著相关的共表达网络模块和系列hub转录调控因子,富集分析显示它们可能参与再生早期细胞的增殖和分化。多个基因家族在蚯蚓再生过程中显著表达,在调控再生发育中发挥着潜在的作用。
图5 再生过程的共表达网络分析。
作者通过加权共表达网络分析(WGCNA)探究再生过程中涉及的大量基因互作效应,确定了19个基因共表达模块,在再生过程中具有高度相似表达模式的基因(图5a)。在棕色模块的表达与再生阶段的相关性最高(图5b),红色和蓝色模块包含再生12h前表达增加的基因,富集参与生物合成过程及调节细胞生长的基因中,蓝色模块富集参与细胞增殖和生长所必需的能量代谢的基因;黑色模块中含有的基因在切断后72h内表达上调(图5h),与持续不断增加的活性及其在在磷酸化、细胞表面受体、酶活性和ATP结合等功能的基因中显著富集,表明其与蚯蚓再生时间调控模式一致,可能在蚯蚓再生过程中发挥着重要的功能作用。
图6 蚯蚓过程中scRNA-seq分析
为探究蚯蚓再生背后的分子和细胞过程之间的复杂相互作用,使用10X Genomics对切割后72h再生的部位进行scRNA-seq。测序结果共捕获2080个细胞,平均每个细胞有493个基因和1904个转录本,经t-SNEs分析识别12个细胞团簇(图6a)。
通过筛选标记基因和构建对应于发育过程的单细胞轨迹来阐明每个簇的细胞类型识别。在蚯蚓基因组中可以确定SOX2和ACTB(涡虫细胞标记基因)具有同源性,并在cluster0/1/3中表达水平较高,基因富集分析显示cluster0/1/3的标记物在干细胞生物学过程中显著表达(图6a-d)。cluster0/1/3中大量的细胞被定位于细胞分化发育轨迹的根部,表明cluster0/1/3中细胞可能代表蚯蚓阶段后72 h假定的多能性干细胞(PSCs)(图6e)。另外,这3个细胞簇具有相似的基因表达谱,且cluster0/1/3具有细胞数量占比最高(图6f)。
蚯蚓在切断后0 ~ 72 h再生早期,原位杂交标记SOX2显示,在切断后6和12 h, PSCs出现在体壁的圆形肌层(图6a-c)。截肢后24、48、72 h, PSCs迅速增殖并迁移至肠上皮(EP)附近的纵肌层,而表皮层未出现PSCs(图7d-f)。
同时,标记基因如TPM44和UNC-8945可以将cluster2/4定义为肌肉细胞,而且cluster2/4/5/6/8混杂地位于单细胞轨迹的类似,这表明cluster5/6/8也可能被称为肌肉相关细胞(图6e),代表我们捕获的第二常见的细胞类型,cluster7中标记到NF70、NBAS和AHNAK基因,具有少数神经元细胞的特征(图6e)。综上所述,结合单细胞转录组数据,本研究确定了蚯蚓再生早期72h后损伤愈合部位细胞的高比例组分是干细胞,暗示诱导型多能干细胞在蚯蚓再生早期过程中具有重要作用。
该研究利用基因组测序技术组装蚯蚓基因组,结合转录组探究了蚯蚓再生发育过程中的复杂分子机制,明确与再生相关的LINEs转座元件及差异表达基因,通过scRNA-seq数据明确蚯蚓内多能性干细胞在再生早期过程中具有重要作用。该研究提供了一些蚯蚓再生的候选分子细胞学机制,提出蚯蚓能够作为研究再生生物学或者再生医学的一个新的模型。
所见即所得,绘图高规格联川云平台,让科研更自由