查看原文
其他

一个函数统一238个机器学习R包,这也太赞了吧

生信宝典 生信宝典 2022-03-28

Caret 是一个试图标准化机器学习过程的一个包。Caret 对 R 中最常用的机器学习方法 (目前支持238个R包)提供了统一的接口。

  • 进行数据预处理

  • 实现机器学习方法流程化模型构建

  • 通过参数组合和交叉验证评估模型的参数

  • 选择最优模型

  • 评估模型性能


一键满足各种掉包,真正实现各种计算方法的结果比较。


如果这些包还不能满足需求,可以自己轻松定义新的方法,基于Caret进行使用。


文档见:https://topepo.github.io/caret/available-models.html



机器学习系列教程


从随机森林开始,一步步理解决策树、随机森林、ROC/AUC、数据集、交叉验证的概念和实践。


文字能说清的用文字、图片能展示的用、描述不清的用公式、公式还不清楚的写个简单代码,一步步理清各个环节和概念。


再到成熟代码应用、模型调参、模型比较、模型评估,学习整个机器学习需要用到的知识和技能。

  1. 机器学习算法 - 随机森林之决策树初探(1)

  2. 机器学习算法-随机森林之决策树R 代码从头暴力实现(2)

  3. 机器学习算法-随机森林之决策树R 代码从头暴力实现(3)

  4. 机器学习算法-随机森林之理论概述

  5. 随机森林拖了这么久,终于到实战了。先分享很多套用于机器学习的多种癌症表达数据集 https://file.biolab.si/biolab/supp/bi-cancer/projections/。

  6. 机器学习算法-随机森林初探(1)

  7. 机器学习 模型评估指标 - ROC曲线和AUC值

  8. 机器学习 - 训练集、验证集、测试集

  9. 机器学习 - 随机森林手动10 折交叉验证

  10. Caret使用 (下一篇)

往期精品(点击图片直达文字对应教程)


后台回复“生信宝典福利第一波”或点击阅读原文获取教程合集

 

(请备注姓名-学校/企业-职务等)


您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存