其他
一个函数统一238个机器学习R包,这也太赞了吧
Caret
是一个试图标准化机器学习过程的一个包。Caret 对 R 中最常用的机器学习方法 (目前支持238个R包)提供了统一的接口。
进行数据预处理
实现机器学习方法流程化模型构建
通过参数组合和交叉验证评估模型的参数
选择最优模型
评估模型性能
一键满足各种掉包,真正实现各种计算方法的结果比较。
如果这些包还不能满足需求,可以自己轻松定义新的方法,基于Caret进行使用。
文档见:https://topepo.github.io/caret/available-models.html
机器学习系列教程
从随机森林开始,一步步理解决策树、随机森林、ROC/AUC、数据集、交叉验证的概念和实践。
文字能说清的用文字、图片能展示的用、描述不清的用公式、公式还不清楚的写个简单代码,一步步理清各个环节和概念。
再到成熟代码应用、模型调参、模型比较、模型评估,学习整个机器学习需要用到的知识和技能。
随机森林拖了这么久,终于到实战了。先分享很多套用于机器学习的多种癌症表达数据集 https://file.biolab.si/biolab/supp/bi-cancer/projections/。
Caret使用 (下一篇)
往期精品(点击图片直达文字对应教程)
后台回复“生信宝典福利第一波”或点击阅读原文获取教程合集
(请备注姓名-学校/企业-职务等)