数据挖掘(GEO,TCGA,单细胞)2022年暑期班(收官之作)
今年的收官之作来的有点早,不过恰好是大家都比较有空的暑期,错过这一期就只能是等待圣诞节元旦节之后了,就是2023年啦。
前面我们在难者不会,会者不难 点出来了其实入门生物信息学确实有方法,而且越来越多人的选择了我们的马拉松直播互动授课。一旦你拥有了数据分析的思维,看待生命科学领域的不同研究也就有了新角度,见:或许怎么做都对呢?
年初我还雄心壮志试图通过无微不至的个性化科研服务来解决各个课题组生物信息学缺乏这个老大难问题,见:我是如何在一年内亏掉100万的,社会现实给我狠狠的上了一课。还是应该专注于我们的人才培养事业, 虽然我们没办法自己产出CNS等轰动的科研成果,但是我们的努力是给广大生命科学科研从业者夯实基础,见:生信分析的本手妙手俗手
2018
在珠海开设线下学徒班、周末班
2019
生信入门班全国巡讲21场(线下)
广州数据挖掘线下小班课3场
单位邀请上门培训3场
2020
生信入门班线上直播课28场
至
数据挖掘班线上直播课26场
2022
生信入门班线下课3场
数据挖掘班线下课3场
3 大纲
R 语言基础与强化训练
GEO 数据库挖掘分析思路与标准流程
多数据集与多分组数据处理
4篇GEO 文献的全部图表复现及完整代码
TCGA 介绍与示例文献解读
TCGA 数据库挖掘分析思路与分析流程
2篇TCGA 文章复现
单细胞数据挖掘流程讲解
1篇单细胞数据挖掘文献图表复现及配套代码!
(全程基于R语言,贴合医学生/临床医师需求,无需学习复杂的Linux技能!)
R语言基础
R语言入门
1.R语言简介
2.R软件和Rstudio的安装
3.Rstudio的介绍、设置和使用
4.适合生信入门的R语言学习路线
5.Rproject与工作目录
6.R语言数据类型介绍
数据管理
1.R语言数据类型的判断和转换
2.数据结构介绍、生成和运算
3.数据筛选和修改
4.数据结构判断及转换
函数与R包
1.函数与参数介绍
2.自定义函数编写
3.R包的三大来源及对应安装函数
4.典型R包举例
5.R语言镜像设置的两种方法
6.R包安装和使用的逻辑
7.获取帮助的几种方法
8·初学者常见的R包五大报错及解决办法
9.R包进阶:批量安装和避免重复安装
数据读写与R语言绘图
1.R语言数据读入和写出的几对函数
2.R语言内置数据
3.工作目录管理范例
4.R基础包的高级、低级绘图函数和绘图参数
5科研绘图必学ggplot2和ggpubr
6.一页多图和图片保存
7.R语言绘图案例:热图、火山图、PCA、箱线图
8.各种统计分布
R语言进阶应用
1.条件与循环语句及其应用
2.长脚本管理方法
3.tidyverse三大包的应用
4·批处理函数(apply系列)
GEO数据挖掘
GEO数据库挖掘介绍
1.GEO数据库介绍
2.课题设计思路和数据分析流程介绍
3.几篇典型文献解读
4.不同种类的数据区分
GEO数据挖掘实战
1.R包安装与数据准备
2.数据下载与读取
3.芯片注释与分组信息的获取
4.数据质控—PCA、热图、相关性
5.差异分析及结果整理
彩蛋
1.搜索技巧、学习方法、效率工具
2.文献查找、翻译、下载、管理工具
3.PPT技巧、云同步工具、优选学习资源
GEO数据挖掘实战(续)
1.GO和KEGG富集分析
2.多分组的芯片分析策略
3.多个数据集联合分析
4.string网页工具获取ppi
5.cytoscape网络图
6.ppi子网络的拆分
7.hub基因获取
GEO部分总结与提高
1.文章思路介绍与解读
2.图表重现
3.芯片分析常见问题及解决办法
TCGA
SPRING
TCGA数据下载
1.官网下载
2.xena下载
3.gdcRNAtools下载
转录组数据差异分析及其可视化
1.三大R包差异分析
2.火山图、热图、PCA、维恩图
3.TCGA以外的转录组数据差异分析
生存分析、模型构建、免疫分析
1.基因id转换和注释查找
2.任意基因的生存分析
3.单因素cox回归
4.lasso回归与多因素cox回归
5.随机森林和支持向量机模型
6.免疫细胞丰度计算
7.免疫细胞热图、箱线图、PCA、相关性分析
8.肿瘤纯度、免疫评分、机制评分的计算和可视化
数据分析常见需求和文章复现
1.模型评估指标与方法
2.体细胞突变数据处理和可视化
3.任意基因的任意分组比较
4.任意两个分子的相关性分析
5.两篇TCGA文献解读和复现
单细胞数据挖掘
SPRING
单细胞转录组数据分析
1.单细胞转录组三大R包
2.典型文献介绍
3.一篇单细胞文献的解读和复现
Linux系统入门视频及配套练习免费领取
Linux云服务认识及登录
操作系统目录和文件操作
文本处理基础及进阶三驾马车
元字符,通配符及shell中的各种扩展
软硬链接,绝对路径和相对路径,环境变量
任务提交及批处理
软件安装及管理
其它视频课程及PDF书籍全套
R语言系统入门视频及配套习题免费领取
了解常量和变量概念
加减乘除等运算(计算器)
多种数据类型(数值,字符,逻辑,因子)
多种数据结构(向量,矩阵,数组,数据框,列表)
文件读取和写出
简单统计可视化
无限量函数学习
其它视频课程及PDF书籍全套
RNA-seq数据分析视频及配套习题免费领取
RNA-seq我们在生信技能树应该是至少推出了400篇教程,而且是我们全国巡讲的标准品知识点,其中还有一个阅读量过两万的综述翻译及其细节知识点的补充:
但凡有Linux基础以及R语言认知,听完了我B站的RNA-seq分析流程都是可以迅速上手自己的项目啦!
GEO和TCGA数据挖掘视频及配套习题免费领取
GEO数据挖掘视频我们已经打磨好了多套无脑代码,在:一个甲基化芯片信号值矩阵差异分析的标准代码 ,和免费的数据分析付费的成品代码 。当然了,需要你具备R语言基础知识,才有可能看得懂和使用我们的完美代码!
关于TCGA数据挖掘,大多数需求其实也就是差异和相关性,生存分析等等,我们的视频目录如下:
P1-TCGA-101-课程介绍-需要哪些背景知识
P2-TCGA-102-课程导读-如何使用我的github代码
P3-TCGA-103--TCGA数据库大有作用-不仅仅是灌水
P4-TCGA-201-背景介绍及网页工具大全
P5-TCGA-202-其它数据库介绍
P6-TCGA-203-使用Xena网页工具
P7-TCGA-204-使用firehose网页工具
P8-TCGA-205-文章规律讲解
P9-TCGA-301-数据下载方式导言
P10-TCGA-302-GDC下载数据实战
P11-TCGA-303-GDC数据整理
P12-TCGA-304-GDC下载数据续集
P13-TCGA-305-R-TCGA包下载数据及数据提取
P14-TCGA-306-使用GDC和firehose下载-TCGA的胃癌的甲基化信息数据
P15-TCGA-307-使用GDC和Xena下载RNA-Seq的表达矩阵并且比较
表观调控等多组学分析视频及配套习题免费领取
01 果蝇参考基因组和注释文件准备
02 文献测序原始数据下载
03 ChIP-seq 数据质量控制与过滤
04 ChIP-seq 数据从比对到 Peaks calling
05 RNA-seq 数据从比对到定量
06 用幕布展示此课程目录
07 验证目标基因的指定外显子 knock out 是否有效
08 多个样本基因信号矩阵来相关性计算与可视化
09 对RNA-seq数据找差异基因以及可视化
10 根据差异倍数来计算样本间相关性
11 使用 ChIPseeker 对单组 Peak 进行注释与可视化
12 对多组 Peaks 进行批量注释与可视化
13 通过 bw 文件来计算 ChIP-seq 样本间相关性
14 探索ChIPQC 包用法并且查看 ChIP-seq 数据质量
15 最新版参考基因组注释peaks之果蝇 dm6
16 样本间 Peaks 交集韦恩图
17 基因组版本注释转换
18 使用 R 和 linux 对多个 bed 进行骚操作处理
19 对单个 bed 文件和 bw 文件可视化
20 多个 bw 文件进行可视化
21 获得差异表达基因 bed 文件
22 对多个基因集进行富集分析
搜索技巧、学习方法、效率工具;
文献查找、翻译、下载、管理工具;
PPT 技巧、云同步工具、资料推荐。