450K甲基化芯片数据处理传送门

Original 旭日早升&&jimmy 生信技能树 2022-06-06

收录于合集 #甲基化 32个

写在前面

Illumina甲基化芯片目前仍是很多实验室做甲基化项目的首选，尤其是对于大样本研究而言，其性价比相当高。这种芯片的发展主要经历了27K、450K以及850K，目前积累的数据主要是450K芯片的，未来850K可能会成为主流。之前我写过一篇450K芯片预处理的帖子，其中也介绍了这种芯片的基础知识以及流程图和代码，大家可以先看看。芯片的处理流程一般就是：数据读入——数据过滤——数据校正——下游分析。

step1:计算机资源的准备

与测序相比，芯片的处理可能对计算资源的要求是不算高，主要使用的工具就是R，R的使用比较耗内存，尤其是处理大批量数据的时候。

R本身是支持各种系统的，所以不管是mac、windows还是linux理论上都是可以的，只要下载对应版本即可。当然，如果你会linux最好在linux操作。其实数据分析很多都是相通的，所以之前群主推荐的配置和工具都是可以拿来用的。

需要安装的R packages包括 ChAMP，minfi和wateRmelon等.

作业1

安装好R软件及相应的包，下载R包的说明书，整理它们的官网链接。
了解illumina 450K甲基化芯片的探针设计，下载manifest文件。

step2:读文章拿到测序数据

本次讲解用到的数据来自文章The relationship between DNA methylation, genetic and expression inter-individual variation in untransformed human fibroblast

从文章里面找到数据存放地址如下：https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE52025

作业2

看文章里的methods部分，把它的分析步骤摘抄下来，然后理解GEO数据库的数据存放形式，把规律和笔记发在论坛上面，类似于RNA-seq数据处理入门和CHIP-seq数据处理入门

step3:了解芯片数据

需要阅读相关的资料，比如illumina的官网介绍及相关的文献，对甲基化及该芯片的技术核心有一定了解，对于存在的问题也要知道，这对于后面分析时理解校正的意义非常重要！

作业3

理解芯片的probe，Bead，p值，I型探针和II型探针等。

step4:了解probe注释

在GEO或者illumina下载450K注释文件，理解每一列的意义及探针的分类。或者下载官网的manifest文件并且理解。

作业4

下载注释文件，理解甲基化探针的分类及注释。

step5:数据读入

处理甲基化芯片的R包其实很多，我之前用的是minfi，现在用ChAMP应该更加方便，它整合了很多分析处理数据的方法，例如过滤和校正等，所以大家可以以ChAMP为主。

作业5

查看甲基化芯片文件的命名规则，整理文件读入所需的表格，使用ChAMP包读入文件。

step6:数据过滤及数据校正

数据过滤主要是根据p值和bead数，probe还需要注意过滤snp和multiple-hit，样本过滤可以考虑PCA或MDS，很多时候R包会直接帮我们做了，但是需要对过滤的标准做到心中有数。

数据校正主要是I型探针和II型探针校正，批次校正和混杂因素校正等。

作业6

根据p值和bead数过滤探针和样本，过滤SNP和multiple-hit的探针，使用BMIQ校正探针类型，使用combat校正批次效应，使用lm校正混杂因素。

step7:下游分析

下游分析一般根据需求来定，比如差异甲基化分析、甲基化与表达的整合分析等。

作业7

学习T-test和线性回归的差异甲基化分析。

step8：探针注释、绘图等

甲基化探针可以根据官方给的注释文件进行基因和CGI的注释。

也可以使用webgestalt对感兴趣的探针做GO和Pathway的分析。

可以使用ggplot等对探针的分布进行绘图。

作业8

理解甲基化探针的CGI及基因位置注释并且简单可视化。

后记

希望和大家一起学习，共同进步。

震撼！上海开放Google、Meta等国际平台，中国数字化迈出历史性一步！

战争烈度再升级，特朗普加征10%对华关税

特朗普称计划对中国商品征收25%的关税，外交部回应

从地方目标看全国！今年经济增长还是有很高要求

二姐李思林早知道李玟有轻生的念头，居然没一点防备措施！

450K甲基化芯片数据处理传送门

写在前面

step1:计算机资源的准备

作业1

step2:读文章拿到测序数据

作业2

step3:了解芯片数据

作业3

step4:了解probe注释

作业4

step5:数据读入

作业5

step6:数据过滤及数据校正

作业6

step7:下游分析

作业7

step8：探针注释、绘图等

作业8

后记

您可能也对以下帖子感兴趣

震撼！上海开放Google、Meta等国际平台，中国数字化迈出历史性一步！

战争烈度再升级，特朗普加征10%对华关税

特朗普称计划对中国商品征收25%的关税，外交部回应

从地方目标看全国！今年经济增长还是有很高要求

二姐李思林早知道李玟有轻生的念头，居然没一点防备措施！

生成图片，分享到微信朋友圈

450K甲基化芯片数据处理传送门

写在前面

step1:计算机资源的准备

作业1

step2:读文章拿到测序数据

作业2

step3:了解芯片数据

作业3

step4:了解probe注释

作业4

step5:数据读入

作业5

step6:数据过滤及数据校正

作业6

step7:下游分析

作业7

step8：探针注释、绘图等

作业8

后记

您可能也对以下帖子感兴趣