查看原文
其他

免费在线小工具-突变分析系列:突变注释信息汇总

HellsegaMosken HellsegaMosken 2024-03-27



前言

在进行肿瘤或全外分析的时候,对于突变信息的挖掘和可视化是一个绕不开的话题,近期打算开一个突变分析的系列工具,本文就当开胃菜介绍一个入门级的小工具,让我们快速了解手中突变数据的总体情况。


适用场景

分析MAF格式文件,并进行数据汇总统计。


MAF是用于存储突变信息的常用格式,关于它的详细信息可以参考:

https://docs.gdc.cancer.gov/Data/File_Formats/MAF_Format/


MAF文件的列名要求以及如何生成可以见本文末的附录。


云工具

地址:https://www.omicstudio.cn/tool/71


分析内容

1.样本信息汇总

对全部信息进行汇总,统计样本个数、基因个数以及各种突变类型的总数、均值和中值。


2.基因信息汇总

一行为一个基因,一列为一种突变类型,表中为该基因的此突变类型的计数,非常方便对基因进行比较,或者查看某种突变类型较多的基因有哪些。


3.MAF记录信息汇总

MAF文件的拓展性很好,不同软件和分析条件下可记录的信息都有所不同,此部分可以快速查看您的文件中记录了哪些信息,对于下游分析来说,有些信息是必不可少的,通过此部分可以快速判断您的数据可否做下游的某些分析。


操作说明

1.上传文件

需要maf格式的文件且后缀名为maf(若格式不符,仅修改后缀名是无效的)。

2.结果下载

上传文件后自动开始分析,在页面确认内容无误后即可下载。输出文件名默认是上传的文件名,也可自行修改。点击下载即可打包下载上述所有分析内容。


解压后内容如下:


分析记录:云平台自带,包含以下内容

分析结果:excel表中有三张sheet,分别包括上述的三项分析内容。


拓展分析

此汇总信息对我们来说肯定是不够的,分析完成后,会自动跳出侧边栏,点击可直接进行下游分析,无需重新上传文件:


如我们点击一个【突变信息摘要图】分析,在弹框中点击跳转:


跳转后会提示文件传送成功,背景中的图片就是用您的文件进行绘制的结果(而不是示例数据啦)


更方便的是,在此分析完成后,您可以继续跳转完成其他拓展分析:



其他拓展分析我们会在继续发文进行介绍,欢迎关注本公众号获取更多信息:


参考资料

http://www.bioconductor.org/packages/release/bioc/vignettes/maftools/inst/doc/maftools.html


附录

如何生成
- 对于 VCF 文件或简单的表格文件,简单的选择是使用vcf2maf实用程序,该实用程序将注释 VCF、确定转录的优先级并生成 MAF。最近对 gatk 的更新还使funcotator能够生成 MAF 文件。
- 如果您使用ANNOVAR进行变体注释,maftools 有一个方便的功能annovarToMaf可以将表格 annovar 输出转换为 MAF。
MAF列名要求
- MAF 文件包含许多字段,从染色体名称到宇宙注释。然而,maftools 中的大部分分析都使用以下字段。
- 必填字段:Hugo_Symbol、Chromosome、Start_Position、End_Position、Reference_Allele、Tumor_Seq_Allele2、Variant_Classification、Variant_Type 和 Tumor_Sample_Barcode。
- 推荐的可选字段:包含 VAF(Variant Allele Frequecy)和氨基酸变化信息的非 MAF 特定字段。
- MAF文件的完整规范可以在【NCI GDC】文档页面上找到:https://docs.gdc.cancer.gov/Data/File_Formats/MAF_Format/


还有什么想开发的云工具,可填写此调查问卷,选中并上线的话有机会免费获得联川生物书籍一本哦:https://www.wenjuan.com/s/UZBZJvPSgg/?is=qrcode


联川书籍:https://weidian.com/?userid=1659112072&wfr=c&ifr=itemdetail&source=shop&sfr=app


联川生物云平台主页:https://www.omicstudio.cn/index


云平台精选资料汇总:https://mp.weixin.qq.com/s/rP_m-O8FTmG6DXr4rbE74w


继续滑动看下一个
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存