查看原文
其他

久等了,果子学生信最新课程报名通知。

果子 果子学生信 2023-06-15

我们的生信数据挖掘线下培训课来了。
课程目前已经迭代多次,是个有体系的课程,对于初学者比较友好。
整个课程的设计和迭代,依托于三句话。

第一: 美图虽好,不是首选。

我们在一开始就强调过:

尽管漂亮的图表是刚需,无论基金还是文章都需要,却是初学者最不应该学的。初学者应该把有限的精力用在数据清理上。R语言的特点就是R包多,我们只要把数据调整到R包需要的格式,就可以轻易做出漂亮的图片。

所以,这门课不会教某一个图的画法,而是尝试教会大家任意常见图的画法,这在其他软件里面可能性很小,但是R语言可以做到。因为我们有R包!
借助于前人的智慧,我们可以轻松地画出以下的图片:
从转录本层面给出某个mRNA或者lncRNA在癌症亚型配对样本中的表达


某个基因和免疫浸润细胞的相关性作图

基于lasso的模型构建系列图

重点在这!

所以,R语言初学者最重要的技能是数据调整,这是架设在已知和未知间的桥梁。正因为有了这样的理念,我们的课程有了灵魂,我们知道了技能的优先主次,我们从不花大量时间挨个去一张张教作图。虽然我们晚上要上课,但是时间还是不够,不能让一些优先级不高的技能占用时间。

第二:好的课程,要让学员觉得自己牛逼,而不是让学员觉得讲师牛逼。

这句话极其有魔力,只要看过一遍,你就不能适应课程中讲师炫耀的环节。培训,首先要要保证的是学员是否能有收获,脱离了当前的例子,是不是能把数据处理和转换的能力泛化。

每次想到这句话,我就知道应该用浅白的语言体系来描述知识点以及授课,比如关于因子的部分,我只讲了两个知识点,一是因子就是分类器,二是因子如何排序:


在讲order和sort区别的时候,干脆做了个动画,讲清楚为什么sort返回的是数值,order返回的是位置。

在讲数据结构的时候,我想化繁为简,提出向量,矩阵,数据框,列表本质上都是一个东西,是挂在晾衣绳上的小盒子:这样我们就能理解,对于data.frame而言,为什么names()和colnames()返回的结果一样,为什么获列的时候df[,1]和df[1]的结果也一样,还有,对于批量读入的数据如果存为列表,可以使用do.call(cbind,list)把列表变成数据框,因为本质上他们都是一个结构。

这样还不够,为了让学员相信,只要愿意,每个人都可以通过检索画出美图,我们在现场和学员一起配合,从零开始,只用学员给出的关键词检索网络,画出如下的火山图,学员们自己都不敢想象!

既然检索这么有魅力,我们索性在课程中穿插讲解了检索的实际运用,没有哪个大神是别人教出来的,他们都是在入门后自学成才。自学过程中,检索是最重要的技能。

  • 我们教过大家如何用检索解决R语言报错

  • 如果通过检索获取想要的资源和教程

  • 如何用检索查询本领域的数据,无论你是心内科还是神内科,都有数据可用

  • 我们还展示过一次无敌人肉

之后我最喜欢听到的反馈时这样的


拥有自己解决问题的信心,觉得自己牛逼,心里有满满的膨胀感,这才是这个课程想要达到的效果。

最高光的时刻是这个:有一个小姑娘,她直到上课时,都不知道数据挖掘是什么,一脸懵圈。但是令人欣慰的是,她回去后不停学习,现在把文章也投了。知道我要去北京,她送了本书给我,还带了一张满带感情,让我欣慰的卡片:

第三:会送录屏的线下生信课程。

技能类的培训,不练就废。虽然我们说这个课程很好,但是并不是听了课就自然而然的会了,看懂和能做不是一个概念。所以,从第一次上课开始,我们就决定免费赠予上课的录屏。这不是行业规则,本质上赠送视频损失的是讲师的利益,但是,只要能让学员获益,我们愿意这样做。

凡是技能,皆需磨练。我们不希望那些对数据挖掘没有任何概念的学员来参加(虽然有一些从零开始学习已经投文章了),如果你是刚入门的研究生,我们更希望大家做的事情是阅读文献,阅读文献,阅读文献。通过这种廉价高效的方法,积累科研思维,等到你觉得当前的条件无法满足你的时候,再入生物信息这个门。那时候,你会觉得,大量文献阅读的效果会在这个技能的加持下会翻倍。这不是一段轻松的旅程,入门大概需要30小时,之后开始实战,实现自己的小目标,大概使用100个小时的时候会觉得小有所成。所以,报名前请评估自己的时间。

常见问题:

1.你们教哪些内容呢?
第一天加晚上,R语言基础和数据调整的所有技能,为什么是所有?是不是话说的太大了?不!我们承诺,无论以后如何答疑,都不会用到超出第一天的内容,因为当我使用R语言3000个小时的时候发现,核心的能力就只有那么多,我把它们抽离了出来,就变成了第一天的内容,这是一个化繁为简的操作。

第二天讲实战,包括整套的GEO教程和TCGA转录组教程。为什么选这两个呢?因为GEO是芯片的代表,TCGA是转录组数据的代表,用20%的精力去学习80%的技能,第二天的课程过后,我们能够处理所有GEO的表达谱芯片数据,自己测的转录组数据也能个性化分析,要知道公司的下游分析就只能看一下,不能用。

2.为什么是GEO的所有表达谱芯片呢?是不是话说的太大了?
不,本次课程的学习并没有停止在课堂之上,课程也不是只有2天半,对于那些真心想学的朋友,本次课程至少持续6个月。因为,我已经在果子学生信开启了连续6个月的写作模式,会把所有重要不重要的数据分析技能和常见套路一网打尽。但这是典型的用80%的精力学习剩下20%技能,只要想学,愿意学,教程源源不断。后续的内容包括了模型构建(已经在课程中),肿瘤免疫,肿瘤微环境,文献解读以及根据要求更新的教程。通过果子学生信公众号报名的朋友,为了感谢你的信任,可以获取每天R语言教程的数据示例数据,方便跟着练习。

3.既然已经录了屏,有没有考虑变成线上课程?
暂时没有。线下课程存在的一个重要意义在于,给学习增加仪式感,很多学员,为了上课,提前换班,加班写病历,给自己腾出两天半的时间,在那段时间内,没有任何烦心事的打扰,这对一个成年人是极其珍贵的。
大剂量冲击疗法十分适合入门一个新技能,高效地学习17个小时,能入门就入,不入门就弃,快速决断,省时省力。不要想着拿着海量的资源以后有时间再学,不会的,大部分人除了能看40集的电视剧,从未短时间内看过40集的教程。

4.生信可以自学么?
当然!生信是可以完全自学的,洲更就事这样的典型。但是成年人做事考虑的是成本,如果你是学生,那么时间成本就比较低,适合自学,如果已经上班,可能时间成本就高一点,尽量避开自己摸索的过程。

本次会议的通用课表(每次会作改动)

本次会议的时间地址:

在帖子下面的置顶留言中。

会议费用:

3400元/人
(按交费先后顺序安排座次,注册费包含会场、教材、午餐、视频课程等费用,不含住宿费)

如果有意愿,给我发邮件报名:

guoshipeng2008@126.com
模板如下:
我想报名参加 用R语言进行科研数据挖掘实战会议,以下是我的信息:
1、姓名:
2、性别:
3、邮箱:
4、手机:
5、发票抬头:如不确定,先留空。
6、纳税人识别号或统一社会信用代码:如不确定,先留空。
7、是否预订住宿:如需预订住宿请注明,一般默认住宿时间是从会议前一晚到会议最后一天中午退房,如果有特殊需要请注明。
8、备注:备注说明写在此,如有多人参加,请将姓名、性别、邮箱、手机在上面分别单独列出,备注中写明一位主要联系人。


额外说明

本条招生帖子因为阐述了授课理念,会一直放在公众号不做更改,如果有新的城市,新的场次,会更新在置顶留言。
有任何疑问,请加我微信guotosky盘问。
如果你是老学员,并且认同授课理念觉得靠谱,欢迎推荐给身边关系好的并且有需求的人。但是,不需要劝说别人过来上课,当你们在推荐时,本质上搭上了自己的信誉,我希望你们确实是因为这个课程受益,而不是抹不开情面。

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存