查看原文
其他

数据挖掘(GEO,TCGA,单细胞)2021第6期

生信技能树 生信技能树 2022-06-06
常有人问两个线上直播课的区别,在这里简单介绍一下:

生信技能树的粉丝都知道我们有一个全国巡讲的良心学习班,口碑爆棚,生物信息学入门省心省时省力!先看看大家的反馈吧:
这里是生信技能树专为医学生/医生而准备的生信线上课程,如果你也想学习公共数据挖掘技能而苦于无人带领,想学习生信却对代码望而却步,这门课程可能是你最好的选择~

尽管很多生信课程宣传写着“无需学习R语言”,尽管很多声音会告诉你“网页工具就够用”,我们依然相信一分耕耘一分收获,生信博大精深,持续学习才是正道。当你有了更高的需求,网页工具无法满足时,就会看到R语言多么强大
曾经被问过很多次,学R语言难么?没有基础行不行?
使用R语言的人大多不是专业的程序员,而是生物学家、统计学家们,难度并不像其他编程语言那么阔怕。另外,我们的课程是从零基础开始讲的,重要的并不是现在有没有基础,而是肯不肯付出足够的时间和精力,去学习,去练习,去思考。只要你有决心,肯行动,请相信我们有足够的经验和实力,为你保驾护航!

学生信最好的时机是6年前,其次是现在啊。

不要犹豫了,滑到文末,找到小助手的微信,直接扫描二维码进行咨询并且报名参加,8月2号开课,长达3周直播辅导互动答疑你值得拥有,这绝对会是你人生最正确的决定之一。后续根据疫情被控制的情况选择性开启线下全国巡讲哦,敬请期待。


1 课程介绍

   

生信技能树教学团队在生信菜鸟团博客、生信技能树论坛及同名公众号数万篇教程的基础上,经历7年沉淀和发展,探索设计了一套完全适合初学者入门且富有趣味的课程,循序渐进地带你越过初学生信的障碍,用优秀的数据分析与可视化技能为科研和工作增光添彩。目前团队成功举办的课程有:

2 时间地点

   

时间:8月2号开始,连续三周。
每周五天课程(周三、周日休息),每天晚上 8:00~11:00,每次3 小时线上互动直播,总时长45 小时。
地点:由你定,前提是需要稳定的网络,下载钉钉软件即可。
直播课程提供回放,即使你时间安排不开,也是可以第二天抽时间补上的,而且有专门的微信群答疑!

3 大纲


   

  • R 语言基础与强化训练

  • GEO 数据库挖掘分析思路与标准流程

  • 多数据集与多分组数据处理

  • 4篇GEO 文献的全部图表复现及完整代码

  • TCGA 介绍与示例文献解读

  • TCGA 数据库挖掘分析思路与分析流程

  • 2篇TCGA 文章复现

  • 单细胞数据挖掘流程讲解

  • 1篇单细胞数据挖掘文献图表复现及配套代码!

(全程基于R语言,贴合医学生/临床医师需求,无需学习复杂的Linux技能!)

4 课表

   


右边工具条可上下滑动

 R语言基础




 R语言入门

1.R语言简介

2.R软件和Rstudio的安装

3.Rstudio的介绍、设置和使用

4.适合生信入门的R语言学习路线

5.Rproject与工作目录

6.R语言数据类型介绍


数据管理

1.R语言数据类型的判断和转换

2.数据结构介绍、生成和运算

3.数据筛选和修改

4.数据结构判断及转换


函数与R包 

1.函数与参数介绍

2.自定义函数编写

3.R包的三大来源及对应安装函数

4.典型R包举例

5.R语言镜像设置的两种方法

6.R包安装和使用的逻辑

7.获取帮助的几种方法

8·初学者常见的R包五大报错及解决办法

9.R包进阶:批量安装和避免重复安装


数据读写与R语言绘图

1.R语言数据读入和写出的几对函数

2.R语言内置数据

3.工作目录管理范例

4.R基础包的高级、低级绘图函数和绘图参数

5科研绘图必学ggplot2和ggpubr

6.一页多图和图片保存

7.R语言绘图案例:热图、火山图、PCA、箱线图

8.各种统计分布


R语言进阶应用

1.条件与循环语句及其应用

2.长脚本管理方法

3.tidyverse三大包的应用

4·批处理函数(apply系列)

GEO数据挖掘




GEO数据库挖掘介绍

1.GEO数据库介绍

2.课题设计思路和数据分析流程介绍

3.几篇典型文献解读

4.不同种类的数据区分


GEO数据挖掘实战

1.R包安装与数据准备

2.数据下载与读取

3.芯片注释与分组信息的获取

4.数据质控—PCA、热图、相关性

5.差异分析及结果整理


彩蛋 

1.搜索技巧、学习方法、效率工具

2.文献查找、翻译、下载、管理工具

3.PPT技巧、云同步工具、优选学习资源


GEO数据挖掘实战(续)

1.GO和KEGG富集分析

2.多分组的芯片分析策略

3.多个数据集联合分析

4.string网页工具获取ppi

5.cytoscape网络图

6.ppi子网络的拆分

7.hub基因获取


GEO部分总结与提高

1.文章思路介绍与解读

2.图表重现

3.芯片分析常见问题及解决办法

TCGA

SPRING



 TCGA数据下载

1.官网下载

2.xena下载

3.gdcRNAtools下载


转录组数据差异分析及其可视化

1.三大R包差异分析

2.火山图、热图、PCA、维恩图

3.TCGA以外的转录组数据差异分析


生存分析、模型构建、免疫分析

1.基因id转换和注释查找

2.任意基因的生存分析

3.单因素cox回归

4.lasso回归与多因素cox回归

5.随机森林和支持向量机模型

6.免疫细胞丰度计算

7.免疫细胞热图、箱线图、PCA、相关性分析

8.肿瘤纯度、免疫评分、机制评分的计算和可视化


数据分析常见需求和文章复现

1.模型评估指标与方法

2.体细胞突变数据处理和可视化

3.任意基因的任意分组比较

4.任意两个分子的相关性分析

5.两篇TCGA文献解读和复现

单细胞数据挖掘

SPRING



 单细胞转录组数据分析

1.单细胞转录组三大R包

2.典型文献介绍

3.一篇单细胞文献的解读和复现

部分图表:

具体的图表数量再多也是有限的,我们更注重的是帮助你搞定R语言画图的方法和规律,授人以渔~

5 课前准备与课后答疑

   

开课前一周为课前准备时间,团队会保障大家顺利安装软件、R 包;课后一个月为快速答疑期,将在微信群详细解答学员提出的问题。(群不解散,一个月后仍可提问,但不保证响应速度)
我们不仅关心你的课前课中课后,还设计了课上和课后的强化练习题,且会根据所有学员的反馈不断升级课程,因为用心,所以更好!
6 授课团队

   

孙老师,生信技能树核心成员,生信星球公众号创办人之一,简书、公众号原创作者、今日头条认证优质作者。自 2018 年 5 月起,在各写作平台分享了数百篇生物信息学笔记、教程,累计 20 万+字(字数统计不包括代码),如《详解 R 数据科学》,《蛋白结构预测与分子对接》、《R 包 shiny 开发网页》、《ggplot2 作图》、《GEO 数据挖掘》、《TCGA》、《R 包开发》等系列;
2018 年 8 月至今,开办了100+期线上学习小组,指导了上千名生信小白零基础入门,十分了解初学者入门生信的障碍、心理和常见问题;
2019 年 担任生信技能树团队线下讲师,主讲了全国巡讲的 R 语言和 GEO 数据挖掘部分、广州专场 GEO 数据挖掘课和多场上门培训,累计 30 多场。
2020年全面转为线上课,主讲了数据挖掘直播课和全国巡讲全球听课程的 R 语言、 GEO 数据挖掘部分,累计22场。
课堂轻松有趣,重点明确,讲练结合,给学员充分的练习和试错机会,掌握必备的数据处理、挖掘、可视化等技能。
配备生信技能树强大的助教队伍,他们基础扎实、数据分析经验丰富,并多次参与线上和线下课程助教工作,全方位保障你的入门!
7 学员福利

   

7.1 第一个福利 买一得五

   


报名2021数据挖掘线上班的全新教学项目者,除了可以参加45个小时的线上视频直播课程,以及一次免费广州的线下学习班(但需缴纳500元场地费)之外,还可以继续享受5个福利

Linux系统入门视频及配套练习免费领取

Linux云服务认识及登录

操作系统目录和文件操作

文本处理基础及进阶三驾马车

元字符,通配符及shell中的各种扩展

软硬链接,绝对路径和相对路径,环境变量

任务提交及批处理

软件安装及管理

其它视频课程及PDF书籍全套

R语言系统入门视频及配套习题免费领取

了解常量和变量概念

加减乘除等运算(计算器)

多种数据类型(数值,字符,逻辑,因子)

多种数据结构(向量,矩阵,数组,数据框,列表)

文件读取和写出

简单统计可视化

无限量函数学习

其它视频课程及PDF书籍全套

RNA-seq数据分析视频及配套习题免费领取

RNA-seq我们在生信技能树应该是至少推出了400篇教程,而且是我们全国巡讲的标准品知识点,其中还有一个阅读量过两万的综述翻译及其细节知识点的补充:

但凡有Linux基础以及R语言认知,听完了我B站的RNA-seq分析流程都是可以迅速上手自己的项目啦!

GEO和TCGA数据挖掘视频及配套习题免费领取


GEO数据挖掘视频我们已经打磨好了多套无脑代码,在:一个甲基化芯片信号值矩阵差异分析的标准代码 ,和免费的数据分析付费的成品代码 。当然了,需要你具备R语言基础知识,才有可能看得懂和使用我们的完美代码!


关于TCGA数据挖掘,大多数需求其实也就是差异和相关性,生存分析等等,我们的视频目录如下:

P1-TCGA-101-课程介绍-需要哪些背景知识

P2-TCGA-102-课程导读-如何使用我的github代码

P3-TCGA-103--TCGA数据库大有作用-不仅仅是灌水

P4-TCGA-201-背景介绍及网页工具大全

P5-TCGA-202-其它数据库介绍

P6-TCGA-203-使用Xena网页工具

P7-TCGA-204-使用firehose网页工具

P8-TCGA-205-文章规律讲解

P9-TCGA-301-数据下载方式导言

P10-TCGA-302-GDC下载数据实战

P11-TCGA-303-GDC数据整理

P12-TCGA-304-GDC下载数据续集

P13-TCGA-305-R-TCGA包下载数据及数据提取

P14-TCGA-306-使用GDC和firehose下载-TCGA的胃癌的甲基化信息数据

P15-TCGA-307-使用GDC和Xena下载RNA-Seq的表达矩阵并且比较

表观调控等多组学分析视频及配套习题免费领取

01 果蝇参考基因组和注释文件准备

02 文献测序原始数据下载

03 ChIP-seq 数据质量控制与过滤

04 ChIP-seq 数据从比对到 Peaks calling

05 RNA-seq 数据从比对到定量

06 用幕布展示此课程目录

07 验证目标基因的指定外显子 knock out 是否有效

08 多个样本基因信号矩阵来相关性计算与可视化

09 对RNA-seq数据找差异基因以及可视化

10 根据差异倍数来计算样本间相关性

11 使用 ChIPseeker 对单组 Peak 进行注释与可视化

12 对多组 Peaks 进行批量注释与可视化

13 通过 bw 文件来计算 ChIP-seq 样本间相关性

14 探索ChIPQC 包用法并且查看 ChIP-seq 数据质量

15 最新版参考基因组注释peaks之果蝇 dm6

16 样本间 Peaks 交集韦恩图

17 基因组版本注释转换

18 使用 R 和 linux 对多个 bed 进行骚操作处理

19 对单个 bed 文件和 bw 文件可视化

20 多个 bw 文件进行可视化

21 获得差异表达基因 bed 文件

22 对多个基因集进行富集分析


如果你确实是第一次接触我们生信技能树,那么首先恭喜你,你找到家了,先看看我们以前的成果:
根据我与几千名粉丝的沟通得出了一个结论,资料其实并不缺,大家缺的是第一步,是互动是耐心帮你解决最开始的拦路虎这样的服务,所以我们才有线下培训,亲自帮你解决电脑面前的报错,让你的入门不再忐忑。预祝2021年的你,在我们友好的教学团队带领下入门后,生信技能树历史教程合辑会成为你真正的宝藏!

7.2 还有惊喜福利

   

我们的讲师都会给大家准备几个独家技能小福利
  • 搜索技巧、学习方法、效率工具;

  • 文献查找、翻译、下载、管理工具;

  • PPT 技巧、云同步工具、资料推荐。

8.报名与注册

   

注册费 2899 元,可开发票。如果仅仅是参加网课,那么缴费2899即可。
如果同时要参加疫情过后的线下的面对面学习班,可以预缴500元场地费或者到时候真的想参加了再缴费,我们会提前一个月发布线下面对面开课通知(取决于疫情进展情况)的(线下课目前仅限广州地区哦)!(注:线下面对面学习班不是必须参加的哈,我们线上三周课程设置已经足够优秀。)
添加小助手微信即可咨询报名。⏬
最后一个小惊喜,不仅仅是学到数据挖掘, 参加培训相当于进入生信技能树小圈子,解锁更多学习资料以及学习方法!

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存