查看原文
其他

在线平台如何做单细胞测序分析全套?有它so easy!

白介素2 生信宝典 2022-03-28

点击蓝字关注我们

单细胞测序技术是一个越来越Popular的技术,这不前两天还有小伙伴来找白介素同学,说是老板想分析单细胞测序的数据,喜欢追热点,让他们去学 R语言,然后小伙伴自然是懵逼。R语言虽好,学习不易啊,不是一蹴而就的。需要看这么多教程 (见文末)。

专业生物信息学家也懂大家的痛,这不,单细胞测序数据兴起的时代,大佬们就在推出应对单细胞测序数据的在线工具 (Granatum),方便你我他。

聊一下这个分析平台的背景,该平台由夏威夷大学癌症中心等研究团队开发,相关学术论文发表在 Genomic Medicine杂志, IF=8.9. 感谢大佬们开发了这么好用的工具。


另外,Granatum在线工具也是开源的,可以部署到本地,或下载下来学习下其代码写法。

来来来,先看看大概长啥样:

界面干净清爽,一目了然,各个数据分析步骤都列出了,来示例操作一波,检验下效果如何,假设你有一份单细胞的数据,格式如下:

表达数据 (生信宝典注:原始reads count,后面有更详细示例):

meta data信息准备一下 (生信宝典注:meta data包含的是样本属性信息,第一列为样本名字,与表达矩阵第一行一一对应,顺序也最好一致。其他列是样本的来源、分组、其他表型信息、reads比对信息等,有多少写多少,至少2列。属性信息可用于后续的可视化展示、批次效应移除、差异比较等。)






数据格式详解


准备上传数据了,并且提交:




移除批次效应(生信宝典注:下拉框的值对应于样本的属性信息列),操作简单,随心所欲的点击式完成:


PCA和tSNE (在网站点击下就可以做,样品属性信息这里用来设置颜色。这属于质控部分,先看下聚类结果。还在用PCA降维?快学学大牛最爱的t-SNE算法吧(附Python/R代码) || PCA主成分分析实战和可视化 | 附R代码和测试数据

选择标准化方法,进行数据标准化(生信宝典注:标准化后数据的分布一致):




过滤低表达基因 (生信宝典注:过滤低表达基因不只可以加快后续计算速度,还有利于多重假设检验校正)


选择聚类方法,进行聚类,聚类结果可以直接下载

差异分析,提供各种算法的选择:

实际上不需要这么长时间的,稍等几分钟结果就来了

顺手再做个KEGG富集分析

蛋白网络分析和发育轨迹分析


其他单细胞分析软件比较

下面的白介素同学不再演示了,总之就是能完成一套分析,但注意不是从原始数据开始的,而是提供了表达矩阵开始的。 个人认为,就应用而言没有必要从原始数据开始,完全可以从表达矩阵开始,自己做适当的个性化分析,这样的工具足够了,比盲目的为了解决分析步骤去傻傻的学了会R语言有效得多。还是那句话,分工协作产生效能,是现代社会的本质。 有实力的研究团队,在这样一个组学时代,当然是需要配备专业生信专家来加速课题进展的。请不起专业的,偶尔用一用在线工具,辅助下分析,挺好的。


内容就分享到这,科研总是乏味,工具总要好用,白介素同学祝大家科研顺利

(后台回复“单细胞测序”,获取神器链接)


学习单细胞分析不只是学习R语言,这只是一个工具,更重要的是学习如何从全局把控分析,了解整个分析思路,这下面一系列的教程还是适合去看看数据处理的基本原理的。这个月我们的单细胞转录组分析培训班也开始了,一起学习吧。

单细胞系列教程



参考文献:
https://genomemedicine.biomedcentral.com/articles/10.1186/s13073-017-0492-3

End


本次课程与2019年5月10日-12日在北京鼓楼开班,将系统讲述基于和不基于比对的转录组分析流程,从原始数据到表达矩阵、差异基因、富集分析、加权共表达网络、通路分析、可视化绘图等一系列常见操作,理论和实践兼备。单细胞部分包括其建库测序原理,不同单细胞技术的比较、优缺点,单细胞常用R包Seurat、Monocle、Scater的实战等,而其他功能分析部分与群体转录组就比较相似了,可以糅合到一起。

课程大纲

每节课1小时一个主题,理论结合实战,学懂原理,实战实操,全是老司机多年经验和代码的无私分享。下面是课程安排,如11代表第一天第一节课,26代表第二天第六节课,41为两周后的线上集中视频答疑。

编号主题简介
11转录组概述转录组设计、应用、批次效应等
12转录组分析流程简介基于/不基于比对的分析流程讲演
13Salmon定量实战不基于比对直接定量基因和转录本的表达
14差异基因分析 DEseq2样本聚类热图、PCA、火山图、差异热图
15GO、KEGG富集分析和可视化R包,Cytoscape,泡泡图,网络图
16GSEA富集分析,enrichMapGSEA时间序列或相关性富集分析
17R基础数据读写、处理和可视化
21二代三代测序原理介绍建库测序过程及注意事项
22转录组软件安装Linux下一键配置转录组分析环节
23STAR比对拼装差异剪接和差异基因分析
24WGCNA基因加权共表达共表达网络、Hub基因和性状关联热图
25

Cytoscape绘制 PPI互作

KEGG调控通路网络图+基因表达
26常见生信图表解读Illustrator进行CNS修图和排版
27Linux基础详细解释代码和文件格式转换
31单细胞转录组特点介绍不同技术比较、适用性和注意事项
32单细胞数据分析和预处理Cellranger分析,细胞和基因筛选
33单细胞分型Seurat, Scater, PCA, TSNE, SC3聚类
34单细胞发育演化分析Pseudotime, Monocle,细胞周期鉴定
35单细胞Marker基因鉴定Scran, 差异分析,功能分析
36考试、圆桌论坛自评学习效果、知识点回顾
41答疑-线上答疑、考试内容串讲

教程内容简介如下:

转录组的应用、设计和案例分享

  1. 转录组学研究技术介绍

  2. 转录组学实验设计和测序原则、注意事项

  3. 二代、三代测序过程和原理解析

  4. 转录组学文章案例分析

  5. 在线基因表达资源数据库

转录组分析流程实战

  1. 转录组分析流程评估

  2. 测序数据质量评估和清洗

  3. 不基于比对的差异基因分析

  4. 基于比对的差异基因分析

  5. 转录本组装和选择性剪接分析

  6. 目标基因GSEA/GO富集分析

转录组高级分析

  1. WGCNA基因共表达分析

  2. WGCNA基因、表型关联分析

  3. Cytoscape 共表达网络绘制

  4. 转录组常见图形在线绘制

  5. KEGG/Reactome通路图绘制,表达映射

  6. 基因互作的文献挖掘和数据库挖掘展示

单细胞转录组分析

  1. 单细胞数据预处理和校正

  2. 细胞分型,PCA,  TSNE,  SC3聚类

  3. 单细胞发育演化分析

  4. 转录组常见图形在线绘制

  5. 单细胞Marker基因鉴定,差异分析和功能分析

  6. 别人的电子书,你的电子书,都在bookdown中有一本不错的单细胞分析教材

常见图表解读和图形编辑排版

在培训上,结合发表高水平文章,进一步讲解16种常用分析图的原理和使用范围,让你不仅读懂图,更知道如何应用于自己的研究,并亲自轻松完成绘图。

针对大家使用R语言绘图学习时间成本较高的问题,易生信团队针对常用16种图开发了免费绘图网站,一键出图,更可鼠标点选参数修改图形的个性样式。

成果发表是科研过程中不可缺的一部分,发表成果又少不了图形展示。文章图表排版是否整齐规范、协调一致、重点突出对一篇文章的发表也是有不少贡献的。之前推出的文章发表图的修改和排版讲演了部分图形编辑和排版操作,本次培训也会实践从原始图形、到细节修饰再到排版发表的整个过程和注意事项。

基因组浏览器用于多组学数据的可视化和关联分析,本地有IGV,在线有UCSC genome BrowserEpigenomebrowser,各有特色。

生信基础知识

  1. Linux/Windows下Rstudio和Linux命令的使用

  2. Linux/Windows下转录组分析流程的搭建

生物学家必要掌握的ShellR语言基础知识。

(如果基础薄弱,报名付款成功后,可免费领取基础程序课,做好准备工作, 让程序成为我们的得力工具而不是学习新知识的绊脚石。)

单细胞系列教程

定制内容

如果您看到文章中有哪些图或分析工作需要重现,也请提出,一起讲述。

如果您有其它关注的问题,也请报名时提出,把这次课程变成您的定制讲解

  1. 120分的转录组试题(第一份答案)

  2. 120分的转录组试题(第二份答案)

  3. 120分的转录组试题(第三份答案)

授课模式

本课程以讲解流程和实际操作为主,采用独创四段式教学,封装好的代码全部分享,随处可用:

  • 第一阶段 3天集中授课;

  • 第二阶段 自行练习2周;

  • 第三阶段 在线直播答疑;

  • 第四阶段 培训视频继续学习;

  • 实现教-练-答-用四个环节的统一协调。

培训时间

2019-5-10 到 2019-5-12 (线下讲解实战)
每天早9点到晚6点,半封闭式教学 (最后1小时为集中讨论时间,最后一天会稍微提前一些,多留出时间讨论,也方便老师乘车返回)
报到时间:开课当天

授课地点 (暂定,鼓楼附近)

北京市西城区鼓楼附近(鼓楼地铁站周边1公里)。

课程价格

  1.  截止2019-05-03 4500 元/人 (报名官网查看更多优惠)

  2. 名额有限,每次课程报名满40人后自动关闭报名通道

  3. 提供易汉博基因科技实习机会或工作机会

课程福利

  1. 座位按报名并缴费或预付款成功顺序从前到后龙摆尾式排序

  2. 赠送程序基础课一份 (http://bioinfo.ke.qq.com)

  3. 多人(N)组团报名并同时缴费,每人还可减免N-1百元 (最高500)

  4. 赠送金士顿U盘一个(32G含培训数据和脚本)

  5. 附推荐语分享该招生信息到朋友圈,截图发到train@ehbio.com 可获200元腾讯优惠券

复制以下链接
http://www.ehbio.com/Training/ 或
点击阅读原文跳转报名页

易生信系列培训课程,扫码获取免费资料

更多阅读

画图三字经 生信视频 生信系列教程 

心得体会 TCGA数据库 Linux Python 

高通量分析 免费在线画图 测序历史 超级增强子

生信学习视频 PPT EXCEL 文章写作 ggplot2

海哥组学 可视化套路 基因组浏览器

色彩搭配 图形排版 互作网络

自学生信

后台回复“生信宝典福利第一波”或点击阅读原文获取教程合集




后台回复“入群”,百味科研交流群等你加入       

多点好看,少点脱发

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存