科研思路|Nature Ecology & Evolution:基因组结合转录组分析虾夷扇贝发育和光受体蛋白的进化
论文信息
论文题目:Metagenomic analysis revealed the prevalence of antibiotic resistance genes in the gut and living environment of freshwater shrimp
期刊:Nature Ecology & Evolution
IF:10.965
发表时间:2017
点击最下方“阅读原文”下载完整文献pdf文件。
研究背景
构建两侧对称类物种祖先的基因组是研究动物进化的核心问题之一,由于缺少两侧对称类物种祖先的化石样本,通过比较其它两侧对称类物种的基因组进行其祖先的基因组重构建,对于研究其进化十分重要。
之前对于两侧对称类动物的研究主要集中于ecdysozoans和deuterostomes,而对Lophotrochozoans的研究还十分不充分。
现有软体动物的基因组还很少,并且分辨率普遍不高。
软体动物作为Lophotrochozoans最主要的组成部分,具有多种不同的形态,使其成为研究形体演变的合适物种,同时不同的软体动物具有多种不同的眼睛,使其可以用于研究眼睛的进化。
技术方法
虾夷扇贝基因组的测定和拼接
基因组的拼接:
应用Illumina Hiseq2000分别测定180bp、300bp、500bp、2kb和5kb的文库用于基因组拼接,采用一个经过修改的SOAPdenovo用于拼接,以解决高杂合度的问题。
流式细胞仪和k-mer方法估计基因组大小,以大平洋牡蛎作为内标。
基因组完整性评估:
30-35kb fosmid序列应用LASTZ进行mapping,参数“M=254 K=4500 L=3000 Y= 15000 —seed=match —step=20 —identity=85”。
BWA用于mapping180bp文库的全基因组序列,参数“-n 15 –o 1 –e 10”。
全长转录本应用BLAT默认参数,一致性80%进行mapping。
染色体水平拼接:
应用3个家族,每个38-40个个体,用2b-RAD方法进行遗传图谱分析。
遗传图谱marker基因应用BLAST与基因组比对,参数“-e 1e4 –F F –G 5 –E 2 –W 7 –r 2 –q -3 –m 8”,用于染色体锚定。
基因组数据分析:
基因注释、可移动单元注释、重复序列注释。
基因家族收缩和扩张(27个相关物种)、保守单拷贝基因集建立、系统发育树构建、物种分歧时间和进化速度分析、同源基因共线性分析。
50X基因组重测序用于评估SNP和indel,BWA参数“-n 15 –o 1 –e 10”,最大和最下read depths为0.1和2,gaps附近10bp的SNP删除。
虾夷扇贝基因进化研究
发育研究:
采集不同发育时期(受精卵、blastulae、gastrulae、trochophore larvae、D-stage larvae、pedi-veliger larvae、juvenile)和成年虾夷扇贝不同组织(eye、mantle、gill、gonad、blood、digestive gland、striated muscle、smooth muscle、foot)提取总RNA进行转录组测序。
Hox基因应用基因组与HomeoDB进行BLAST比对鉴定,E-value为e-5,MEGA构建系统发育树。
原位杂交用于分析Hox基因在原肠胚时期的空间表达分布
光受体蛋白研究:
人类和果蝇光传导的相关基因下载自NCBI蛋白质数据库,与扇贝基因组BLASTP比对进行注释。
研究结果
基因组拼接及基本分析结果:
估计的基因组大小为1.43Gb,拼接后的基因组大小为988Mb,contig N50为38kb,scaffold N50为804kb,与已发表的双壳类基因组相比具有显著提升。
转录组、fosmid文库和全基因组pair-end数据用于评估拼接的质量和完整性,mapping的比例均在95%以上。
依靠2b-RAD方法建立的遗传图谱,将1419个scaffold分配给了19个染色体,第一次得到了软体动物染色体水平的基因组。
从拼接的基因组中识别到了26415个蛋白质编码基因,91%能够注释到已知的蛋白质。
重复序列占拼接基因组的39%,主要是串联重复(18.4%),可移动单元的比例为8-18%,相比于其它双壳类物种比例较小。
对扇贝的父本进行重测序,发现SNP和indel的比例为1.04%,低于牡蛎的1.30%,但是高于人类的0.14%。
应用482个高保守的单拷贝基因进行系统发育分析,虾夷扇贝的遗传位置与牡蛎相距425Ma,双壳类与腹足类相距504Ma,虾夷扇贝在两侧对称类物种中,蛋白质序列的变化速率较慢,表明其进化缓慢。
对扇贝和其它两个双壳类动物进行基因家族分析,鉴定到9365个基因家族的核心组,与其它24个动物相比,鉴定到756个双壳类特有和567个扩张的基因家族,主要为离子通道和神经传递相关的功能。
基因家族分析鉴定到830个扇贝特有和349个扩张的基因家族。
染色体共线性分析表明,19个虾夷扇贝染色体与17个假定的两侧对称祖先染色体具有高度的一致性,说明虾夷扇贝与两侧对称类动物祖先的核型十分接近。
发育过程分析结果
ParaHox和Hox基因簇在虾夷扇贝基因组中非常保守,使得能够推断出Lophotrochozoan中这两个基因簇的祖先结构。
通过测定虾夷扇贝不同发育阶段Hox基因的表达,进行时间尺度的共线性分析,发现虾夷扇贝Hox基因的表达模式与脊椎动物不同,其在原肠胚使其开始表达,首先是4个先导基因(Hox1、Hox4、Lox5和Post2)开始表达,其它基因随后被激活。
空间共线性分析表明,在原肠胚时期,也是只有4个先导基因表达,而其它基因没有表达,并且4个先导基因在虾夷扇贝A-P体轴中具有明显不同的空间分布,说明这4个先导基因在虾夷扇贝早期体轴发育中具有重要作用。
对已发表的其它物种的Hox基因表达进行时间共线性分析,发现虾夷扇贝中出现的时间共线性规律需要具备完整的亚基因簇而不是全部Hox基因簇。
光受体蛋白分析结果:
在虾夷扇贝的mantle边缘,具有30-100个非脑的眼睛,其具有双层视网膜结构,分别含有杆状和睫毛状的光受体。
在扇贝的基因组中鉴定到十个视蛋白基因,包括四个r型,两个G0型,两个c型和一个peropsin,其主要在虾夷扇贝的眼部表达。
r型和G0型视蛋白分别负责杆状和睫毛状的光传导,在虾夷扇贝的眼睛中,r型视蛋白及其相关cascade的表达要显著高于其它视蛋白,说明杆状的光传导是虾夷扇贝眼睛的主要功能。
c型视蛋白首次在扇贝中被鉴定,并且相关的cascade的表达分析显示,其在扇贝的眼睛中发挥一定的功能。
多种视蛋白在虾夷扇贝眼睛中均发挥功能,为研究多种光传导功能如何在一个可视化系统中统一提供的研究模型。
与mantle相比,虾夷扇贝的眼睛中鉴定到了825个上调表达的差异基因。
假定的两侧对称类动物master control基因Pax6在扇贝眼睛和mantle中均无表达,Pax6路径相关的其它基因要么无表达,要么在眼睛中表达没有差异,说明Pax6依赖的路径与扇贝眼睛的形态学和功无关。
应用26个成年扇贝的转录组数据进行基因共表达网络分析,鉴定到一个与眼睛相关的模块,其中包含眼睛相关的转录因子Pax2/5/8、Brn3、lmx1b和Six4/5,其中前3个被识别为hub。
结合前人的研究,提出推断,脑眼的光受体细胞依赖Pax6路径,而非脑眼的光受体细胞依赖Pax2/5/8路径。