查看原文
其他

我想说几句话

生信技能树 生信技能树 2022-06-06

最近接了几个商业宣传,大家的反应比较激烈:

我看到bioart,测序中国他们各种各样的公众号都是在接这样的宣传,正如我们一直强调的,单细胞的科研热度居高不下,市场就是有这样的需求。


因为博士学业的问题,我不去做,就只能是让给其他人做,哪怕他们这样的商业机构比我差十万八千里,也只能是他们做。毕竟汤富酬也没有去搞这样的商业培训啊,谁规定一定要最优秀的人(我)才能去授课?

关于培训效果

本来就是仁者见仁智者见智,每个人的计算机基础,生物学背景的牢固与否,上课是否集中精神,是否有真正的科研需求把所学知识融会贯通,都影响培训效果。无法一概而论。

而且各种商业培训机构所聘请的讲师能力和组织者能力肯定也是有限的,大家报名的也都是自愿的,只不过如果效果不好影响他们的口碑罢了,你应该是不会幻想听两天课就成为能独立自主分析单细胞数据的生信工程师了吧!

关于单细胞到底该怎么样学

如果你仅仅是没有空自己去搜索资料来了解单细胞,那么培训班会是你最佳选择。

如果你是想成为能独立自主分析单细胞数据的生信工程师,其实最好的方法是按部就班的学习R和LINUX基础,读综述:

那么我为什么不推荐你这样踏踏实实学呢?反而给市面上的单细胞培训班打广告

实在是社会太浮躁啊!我告诉你要花很长时间学R和LINUX基础,你可能就放弃了,但是你一时冲动报名了他们这样的商业培训班,或许就给自己一个契机坚持学下去了呢?

实际上这样的培训班没有价值,但是你自己付出了金钱给自己学习的理由和动力才是价值所在。

或者说,真正我分享的R和LINUX基础才是对你更有帮助的的, 但是你会为它付费吗?

什么是按部就班的学习R和LINUX基础

首先是LINUX学习

我在《生信分析人员如何系统入门Linux(2019更新版)》把Linux的学习过程分成6个阶段 ,提到过每个阶段都需要至少一天以上的学习:

  • 第1阶段:把linux系统玩得跟Windows或者MacOS那样的桌面操作系统一样顺畅,主要目的就是去可视化,熟悉黑白命令行界面,可以仅仅以键盘交互模式完成常规文件夹及文件管理工作。

  • 第2阶段:做到文本文件的表格化处理,类似于以键盘交互模式完成Excel表格的排序、计数、筛选、去冗余,查找,切割,替换,合并,补齐,熟练掌握awk,sed,grep这文本处理的三驾马车。

  • 第3阶段:元字符,通配符及shell中的各种扩展,从此linux操作不在神秘!

  • 第4阶段:高级目录管理:软硬链接,绝对路径和相对路径,环境变量

  • 第5阶段:任务提交及批处理,脚本编写解放你的双手

  • 第6阶段:软件安装及conda管理,让linux系统实用性放飞自我

然后是R学习

我在在生信分析人员如何系统入门R(2019更新版) 里面给初学者的知识点路线图如下:

  • 了解常量和变量概念

  • 加减乘除等运算(计算器)

  • 多种数据类型(数值,字符,逻辑,因子)

  • 多种数据结构(向量,矩阵,数组,数据框,列表)

  • 文件读取和写出

  • 简单统计可视化

  • 无限量函数学习

必备书籍及视频

书籍贪多不烂,下面2本必买,读5遍以上:

视频必须强推生信技能树近30万学习量的基础合辑:

什么才是你应该学的单细胞

如果是10X仪器的单细胞转录组数据走cellranger流程,我们在单细胞天地多次分享过流程笔记:

如果是smart-seq2技术,首先走单细胞下游分析标准流程啊,就是那些R包的认知,包括 scater,monocle,Seurat,scran,M3Drop 需要熟练掌握它们的对象,:一些单细胞转录组R包的对象 ,分析流程也大同小异:

  • step1: 创建对象

  • step2: 质量控制

  • step3: 表达量的标准化和归一化

  • step4: 去除干扰因素(多个样本整合)

  • step5: 判断重要的基因

  • step6: 多种降维算法

  • step7: 可视化降维结果

  • step8: 多种聚类算法

  • step9: 聚类后找每个细胞亚群的标志基因

  • step10: 继续分类

完整文字版教程了

所以你其实可以不需要购买视频了,除非你对我的声音有特殊的爱好,或者其他我不知道的原因:

第一单元:文献背景及课程介绍

第二单元:常规转录组基础知识回顾

第三单元:单细胞3大R包的学习

第四单元:重复文章图表

第五单元:结合公共数据库

学好表达芯片的公共数据库挖掘你很容易毕业升职加薪

GEO数据挖掘技巧,基本上该分享的都在B站和GitHub了,目录如下:

  • 第一讲:GEO,表达芯片与R

  • 第二讲:从GEO下载数据得到表达量矩阵

  • 第三讲:对表达量矩阵用GSEA软件做分析

  • 第四讲:根据分组信息做差异分析

  • 第五讲:对差异基因结果做GO/KEGG超几何分布检验富集分析

  • 第六讲:指定基因分组boxplot指定基因list画热图

  • 第七讲:根据差异基因list获取string数据库的PPI网络数据

  • 第八讲:PPI网络数据用R或者cytoscape画网络图

  • 第九讲:网络图的子网络获取

  • 第十讲:hug genes如何找

系列推文感兴趣的也可以去看看;


其它关于技能树是否应该为培训广告负责的讨论

  • 如果该课程没有涉嫌欺诈,人家就是按部就班的一个培训课,质量高低每个人都有自己的评价,那就不关你啥事。哪有那么多非得负责的事情啊!

  • 公众号需要费用维持运转。要么大家打钱要么卖广告。纯广告的话本身技能树无需负责。不过课程质量不好,学员自然潜意识也会和技能树挂钩,然后降低信任。事情最终会走向一个平衡。

  • 这个广告,我在很多个公众号都看到过,两天一夜单细胞培训,估计新手或者次新手会消化不良,然后评价说质量不好也在所难免。毕竟不是每个人都能意识到自己的基础还不够。

  • 换一个角度,如果只是一个普通的广告宣传,那个费用也轮不到公众号负责。如果是联合开发,可能需要把控,但是人家也未必愿意多给你钱。你也可以在文末加一句,课程实际内容效果和技能树无关。提醒极少数人注意。

  • 就和去饭馆吃饭一样,难吃好吃的都看缘分。只要别吃坏了没人现场掀桌子,还会不会再来另说。如果难吃我也只会觉得大众点评上的推荐是软文,下次不信不会去了,不会让大众点评负责赔钱。

  • 国内培训班都这样啦,毕竟生信方面连个能和Broad Institute竞技的都少。这个的培训班,比起harvard 的那个当然是打不过,不过反正花的不是自己的钱,去参加培训的都有自己的想法吧。

培训当然首先技能树

但是我们团队时间精力有限,每个月只能说去两个城市,今年就只剩下长沙了,12月底的。明年的行程还没有规划好,我们提前一个月督促大家准备工作,3天干货满满的课程结束后还有长达半年的答疑解惑期!

大家的缘分不够,所以无法聆听到我的现场授课,莫得法子啊!

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存