直击多组学数据分析难题,1小时就够了 | 课程回顾
课程回顾
华大科技一年一度的春季培训开启全新模式 ——1小时线上课堂,专注解惑,在线回复,更接受量身定制,让老师们疫情防控、课题研究两不误!3月6日晚,华大科技资深生信分析工程师程佳文老师带来《转录组及表观多组学关联分析思路解析》,以下是课程精华,供大家参考。
课程回顾
表观遗传学(Epigenetics)又译为表征遗传学、拟遗传学、表遗传学、外遗传学以及后遗传学。在生物学和特定的遗传学领域,其研究的是在不改变DNA序列的前提下,通过某些机制引起可遗传的基因表达或细胞表现型的变化。研究内容主要包括两类,一类为基因选择性转录表达的调控,有DNA甲基化、基因印记、组蛋白共价修饰和染色质重塑;另一类为基因转录后的调控,包括基因组中非编码RNA、微小RNA、反义RNA、RNA修饰等。本次课程主要关注DNA水平上的一种修饰重要——5mC, 并从分析层面结合相关文章解析表观组学应如何与转录组数据关联分析。
从数据分析层面上对表观组和转录组进行剖析,将会使得两者的关联变得清晰。对于单一的表观组学甲基化数据的分析我们可以从全基因组、元件(Gene、TE、Promoter……)以及精细到单碱基甲基化水平的层次,由整体到局部逐步分析。对于转录组的数据分析,除了以差异表达量作为感兴趣的基因集合条件外,也可以通过其他条件,比如,在实际分析中通过表达水平梯度进行划分,如果关心的是表达量前10%的基因,那么完全可以以此为自己的关心基因集合去进行关联分析。
在关联分析上比较重要的一种方向,是通过关心基因集合(DEG或其他条件筛选得到)的位置关系关联到DMR,或者通过DMR的位置关系关联到相关基因集合;然后通过对这些相关基因的功能富集分析或通路分析,找到这些基因参与的重要生物学过程;最后,无论是基于实验找到关键的基因,还是举例说明,都可以通过相关基因附近的单碱基甲基化状态去查看详细的情况。
下面这篇文章很好地展示了这种分析思路。首先,作者的研究目的很明确,就是想要探究氧气供给在种子发芽发育过程中,甲基化水平和转录组水平上都有哪些变化,又有哪些潜在的关联。实验设计上也是简单巧妙地取了几个关键时间点的样品,这对于后续的数据分析和实验结论的获得至关重要。
关联分析固然很重要,但是在实验数据分析中,每个组学的数据都能单独挖出十分重要的信息。在该文章的转录组数据的分析中,不仅让我们知道了氧气供给在不同发育阶段对基因数量的影响变化,更为重要的是通过功能富集和通路分析,也很清晰地知道在氧气供给过程中涉及到代谢,特别是能量代谢途径是显著富集的。这也与以往的研究一致,不过本研究在时间点和相关基因的数据上更加细致。
该文章中最为关键的关联分析要点,就是通过DMR与DEG的位置关联,找到关心的基因集合,并按照前文所讲的层次递进,分析展开的方法做进一步的研究。
在找到关心基因集合之后,作者通过表达聚类和甲基化水平展示相结合,细致的观察相关基因的变化与甲基化水平的变化情况,这样能够更为清楚地知道在哪些处理条件下表达水平显著变化了,上调变换的相关基因有哪些附近的甲基化是一个什么样的变化情况,反之亦可分析,并且在实例部分挑出一个基因去展示附近的甲基化状态,将更能展现在不同处理下的变化情况。另外对于关联到的相关基因,完全可以去做一些常规的转录组分析,给予这部分的基因更多数据说明。
课程的最后也给大家展示了其他的关联分析方式。有目的的研究参与特定功能或转录因子相关的基因,通过表达与表观两个维度的数据展示,这为弄清楚5mC是否对影响相关功能基因的问题提供直观的数据回答。
课程答疑
1. Bisulfite-Seq建库样品量有什么要求?
100 ng的起始样本可以得到1个文库,每个文库可以得到7G (50PE)的原始数据。根据BGI的研发初步结果来看,100ng建库的数据比对结果,与常规建库的比对结果相关性很好。
2. 甲基化修饰与组蛋白修饰哪一个与转录组的关联更为密切?
甲基化对基因的调控主要是通过影响相关的转录因子(激活/抑制)与DNA结合,从而达到调控基因表达的目的,组蛋白修饰一般是通过影响染色质的开放性来影响基因的表达,两者的作用方式有区别,但是都是调节基因表达的重要因素。另外一些甲基化的修饰会影响组蛋白的修饰,组蛋白的修饰也会影响甲基化的修饰。(在课程“DNA甲基化的动态调控”这一背景中有相关介绍,详细可以阅读一下PPT底下链接的文章。)
3. DMR的具体参数该怎么定?
首先可以参考本领域相关的研究文章,如果没有可以使用DMR相关软件的默认参数去call,之后看一下相关的结果,一般可以通过调节P-value,窗口大小,覆盖度过滤,甲基化位点等过滤条件调节DMR,之后需要手动挑选一些DMR去查看详细的情况。之后再做相关分析你可能就会有一个经验值。
课程预告
今晚(3月17日,周二)19:30-20:30,华大科技春季培训继续轻松玩转基因组,高级信息分析工程师王翘秀老师将带来《肿瘤分析数据挖掘及信息解读》,高级分析模块精讲,助您变身生信高手!
此外,我们的首次定制课程《空间转录组技术及应用浅析》,也将于3月24日(下周二)14:30-15:30举行,有需要的老师不要错过了!以下是详细课表——
课程回顾:
【1小时从数据到文章系列】
【蛋白代谢全贯穿系列】
新冠之后,感染类疾病可以这样研究一点就通!DIA蛋白组技术解读与数据挖掘请继续关注“华大科技BGITech”
科技君将持续为您提供精彩内容
如有问题,欢迎后台留言~~
▼