查看原文
其他
统计学的重要性毋庸多说,基本上NGS数据分析的每个环节参数的把握,每个图表的理解背后都是统计学背景知识。当然了,对大量入门级别玩家,暂时可以不要考虑那么多,先跟着我在生信技能树的教程肝下去,走出一个完整项目再说。但是大量中高级玩家的需求我们也得满足啦,很久以前我们整理过:统计学回顾(精华目录收藏)(statquest+协和八+ NGSHotpot),可以说是啃这块统计学硬骨头是提升自己的生信段位不二选择!
最近在朋友圈和各种群聊又看到了另外4个好课程,推荐给大家,文末有一个投票,大家可以参与一下。(估计你们没有那么多时间全部看完,就根据目录进行投票即可)

北京大学-席瑞斌

课程链接:http://www.chinesemooc.org/mooc/4979

1. 统计及生物统计概要(2学时)
2. 数据探索性分析、可视化(4学时)
3. 假设检验和置信区间估计(12学时)
  • a)  参数假设检验
  • b)  非参数假设检验
  • c)  Bootstrap方法、permutation 方法
  • d)  多重假设检验
4. 回归分析方法(12 学时)
  • a)  线性回归分析
  • b)  广义线性回归
  • c)  非线性回归方法、广义非线性回归方法
  • d)  混合效应回归模型
5. 高维生物统计学方法 (12学时)
  • a)  模型选择方法
     模型衡量准则;传统变量选择方法,如前向选择方法、后向选择方法;罚函数方法
  • b)  超高维数变量筛选方法
     线性模型中的变量筛选、非线性模型中的变量筛选
  • c)  降维方法
     PCA, NMF,LLE,DiffusionMap, tSNE, UMAP等线性、非线性降维方法
6. 分类、聚类分析简介(6学时)
  • a)  逻辑回归、支持向量机、随机森林等分类方法
  • b)  K-means、混合正态模型、隐马氏模型等聚类方法
初看这个目录我差点以为就是为生物信息学人才准备的,因为确实涵盖了我们生信分析过程的方方面面。

多元统计分析上海财经大学_中国大学MOOC(慕课)

可能因为是财经大学的课程,所以并不会可以强调这些统计学原理在生物信息学领域的应用,不过打基础也是极好的。链接是:https://www.icourse163.org/course/0712TUFC001-1003381022#/info
第一章  矩阵代数
  • 1.1  矩阵的定义和运算
  • 1.2  正交矩阵
  • 1.3  矩阵的行列式、逆和秩
  • 1.4  矩阵的特征值、特征向量和迹
  • 1.5  正定矩阵、非负定矩阵和矩阵函数值的SAS输出
  • 附录1.A  矩阵代数的R代码(选)
  • 附录1.C  矩阵代数的本教材节选(选)
第二章  随机向量和多元正态分布
  • 2.1  多元分布
  • 2.2  数字特征
  • 2.3  欧氏距离和马氏距离
  • 2.4  多元正态分布
  • 2.5  极大似然估计及估计量的无偏性
  • 2.6  JMP入门
  • 2.7  一个案例的JMP演示
  • 附录2.A  多维数据描述及可视化等的R代码(选)
  • 附录2.B  SPSS在多维数据描述及可视化等中的应用(选)
  • 附录2.C  随机向量的本教材节选(选)
  • 附录2.D  多元正态分布的本教材节选(选)
  • 第二章测验
第三章  判别分析
  • 3.1  引言
  • 3.2  两组距离判别
  • 3.3  多组距离判别
  • 3.4  贝叶斯判别——最大后验概率法
  • 3.5  贝叶斯判别——最小期望误判代价法
  • 3.6  费希尔判别
  • 附录3.A  判别分析的R代码(选)
  • 附录3.B  SPSS在判别分析中的应用(选)
  • 附录3.C  摘自本教材的若干数学证明(选)
  • 第三章测验
第四章  聚类分析
  • 4.1  引言
  • 4.2  距离和相似系数
  • 4.3  系统聚类法
  • 4.4  聚类中的若干问题
  • 4.5  动态聚类法——k均值法
  • 附录4.A  聚类分析的R代码(选)
  • 附录4.B  SPSS在聚类分析中的应用(选)
  • 第四章测验
第五章  主成分分析
  • 5.1  引言
  • 5.2  总体的主成分
  • 5.3  样本的主成分
  • 5.4  若干案例
  • 5.5  若干补充及主成分应用中需注意的问题
  • 附录5.A  主成分分析的R代码(选)
  • 附录5.B  SPSS在主成分分析中的应用(选)
  • 附录5.C  摘自本教材的若干数学证明(选)
  • 附录5.D  对主成分综合得分方法的质疑(摘自本教材,选)
  • 第五章测验
第六章 因子分析
  • 6.1  引言
  • 6.2  正交因子模型
  • 6.3  参数估计
  • 6.4  因子旋转
  • 6.5  因子得分
  • 附录6.A  因子分析的R代码(选)
  • 附录6.B  SPSS在因子分析中的应用(选)
  • 附录6.C  摘自本教材的若干数学证明(选)
  • 第六章测验
第七章  对应分析
  • 7.1  引言
  • 7.2  行轮廓和列轮廓
  • 7.3  总惯量
  • 7.4  行、列轮廓的坐标
  • 7.5  对应分析图
  • 附录7.A  对应分析的R代码(选)
  • 附录7.B  SPSS在对应分析中的应用(选)
  • 附录7.C  摘自本教材的若干数学证明(选)
  • 第七章测验

厦门大学MOOC 多元统计分析

被搬运到了B站,之所以注意到这门课,是检查我自己的b站,被人工智能算法推荐的,应该是跟我的课程一样的优秀吧!
链接是:https://www.bilibili.com/video/av92489393  或者 https://www.icourse163.org/course/XMU-1206305809
01  多元统计分析概述
  • 1.1 多元分析的定义
  • 1.2 多元分析的方法简介
  • 1.3 多元分析的应用领域
02  多元数据的描述与展示
  • 2.1 一元随机变量回顾
  • 2.2 随机向量
  • 2.2.1 多元数据的数值特征及可视化
  • 2.2.2 协方差矩阵的用途
  • 2.3 随机向量的变换
03  多元正态分布
  • 3.1 多元正态分布
  • 3.2 多元正态分布的性质
  • 3.3 多元正态的估计
  • 3.4 评估多元正态性
04  均值向量的检验
  • 4.1 多元检验的冬季
  • 4.2 单样本均值向量检验
  • 4.3 两样本均值向量检验
  • 4.3.1 独立样本
  • 4.3.2 成对样本
05  判别分析和分类分析
  • 5.1 判别分析和分类分析概述
  • 5.2 判别分析:分类规则
  • 5.2.1 两群体Fisher线性判别分析
  • 5.2.2 多群体Fisher线性判别分析
  • 5.3 分类分析:分类结果
  • 5.3.1 两群体Fisher分类
  • 5.3.2 两群体贝叶斯分类
  • 5.3.3 多群体分类
06  主成分分析
  • 6.1 主成分分析思想
  • 6.2 总体主成分分析
  • 6.2.1 总体主成分推导
  • 6.2.2 基于标准化的总体主成分分析
  • 6.3 样本主成分分析
  • 6.3.1 样本主成分推导
  • 6.3.2 主成分个数的选择
  • 6.3.3 R语言应用实例
07  因子分析
  • 7.1 因子分析简介
  • 7.2 载荷估计方法
  • 7.2.1 主成分法
  • 7.2.2 其他方法
  • 7.2.3 估计因子得分
  • 7.3 因子旋转
  • 7.3.1 因子旋转的理解
  • 7.3.2 正交旋转和斜交旋转
  • 7.4 R语言示例
08  聚类分析
  • 8.1 聚类分析概述
  • 8.2 层次聚类
  • 8.2.1 简介
  • 8.2.2 层次聚类的类型
  • 8.2.2.1 层次聚类的类型(上)
  • 8.2.2.2 层次聚类的类型(下)
  • 8.2.3 R语言示例
  • 8.3 k-均值聚类
  • 8.3.1 方法介绍
  • 8.3.2 R语言示例

知乎孟大佬的多元统计

在疫情期间孟浩巍录制了一门网络课程,供大家学习——《生物信息学入门课:生信中常用的多元统计分析》,这个是需要付费的,购买链接:https://ke.qq.com/course/709956

目录的话,我只能以截图代替,不然可能会被举报非法原创!


投票开始

选出你心目中的super star吧!

文末友情宣传

强烈建议你推荐给身边的博士后以及年轻生物学PI,多一点数据认知,让他们的科研上一个台阶:

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存