查看原文
其他

工具&方法 | R语言机器学习包大全(共45个包)

简华 数据Seminar 2021-06-04

机器学习,是一门多学科交叉的人工智能领域的分析技术,它使用算法解析数据,从中学习,然后对世界上的某件事情做出决定或预测。

目前,常见机器学习的研究方向主要包括决策树、随机森林、神经网络、贝叶斯学习和支持向量机等方面。本期,我们从CRAN Task Views分类整理了有关Machine Learning主题的R语言包。

图注:图片来自scikit-learn官网




决策树 Decision Trees


1)rpart和tree,递归拆分利用树形结构模型,来做回归、分类和生存分析。其中,rpart可用于进行分类回归树分析(Classification and Regression Tree, CART)。
rpart:
https://cloud.r-project.org/web/packages/rpart/index.html
tree:

https://cloud.r-project.org/web/packages/tree/index.html

2)Weka和RWeka,weka中提供了丰富的分区算法工具箱,rweka包实现了一个接口,包括包括J4.8、C4.5、M5等。
Weka:
http://www.cs.waikato.ac.nz/~ml/weka/
RWeka:

https://cloud.r-project.org/web/packages/RWeka/index.html

3)Cubist,基于距离校正规则的回归模型(类似树模型)。

https://cloud.r-project.org/web/packages/Cubist/index.html

4)C50,适用C5.0分类树、基于规则的模型、以及重抽样功能。

https://cloud.r-project.org/web/packages/C50/index.html

5)party和partykit,提供两类递归拆分算法,即无偏变量选择和统计停止准则递归分类算法。函数ctree()用非参条件推断法检测自变量和因变量关系;而函数mob()用来建立参数模型。
party:
https://cloud.r-project.org/web/packages/party/index.html
partykit:

https://cloud.r-project.org/web/packages/partykit/index.html

6)vcrpart,树形变系数模型。

https://cloud.r-project.org/web/packages/vcrpart/index.html

7)LogicReg ,做逻辑回归分析,针对大多数自变量是二元变量的情况。

https://cloud.r-project.org/web/packages/LogicReg/index.html

8)maptree,提供树结构的可视化函数。

https://cloud.r-project.org/web/packages/maptree/index.html

9)REEMtree,纵向数据随机效应树模型。

https://cloud.r-project.org/web/packages/REEMtree/index.html

10)RPMM,混合效应模型的分类算法。

https://cloud.r-project.org/web/packages/RPMM/index.html




随机森林 Random Forests


1)randomForest和randomForestSRC ,前者提供了用经典的随机森林做回归和分类的函数,后者对回归、分类、生存分析等进行Breiman随机森林算法。
randomForest:
https://cloud.r-project.org/web/packages/randomForest/index.html
randomForestSRC :

https://cloud.r-project.org/web/packages/randomForestSRC/index.html

2)ipred,用bagging的思想做回归、分类和生存分析,组合多个模型。

https://cloud.r-project.org/web/packages/ipred/index.html

3)party,不仅提供了递归拆分算法,还提供了基于条件推断树的随机森林法。

https://cloud.r-project.org/web/packages/party/index.html

4)quantregForest,百分位数回归随机森林算法。

https://cloud.r-project.org/web/packages/quantregForest/index.html

5)ggRandomForests,提供了基于ggplot2工具,用于随机森林模型的图形化探索。

https://cloud.r-project.org/web/packages/ggRandomForests/index.html

6)varSelRF和Boruta,专注于用随机森林做变量选择。
varSelRF:
https://cloud.r-project.org/web/packages/varSelRF/index.html
Boruta:

https://cloud.r-project.org/web/packages/Boruta/index.html

7)ranger和Rborist ,提供接口连接到C++进行随机森林分析。
ranger:
https://cloud.r-project.org/web/packages/ranger/index.html
Rborist :

https://cloud.r-project.org/web/packages/Rborist/index.html

8)RLT,强化学习树,它的特征是变量分裂。

https://cloud.r-project.org/web/packages/RLT/index.html

9)wsrf,实现了一种替代传统随机变量采样的变权子空间选择方法。

https://cloud.r-project.org/web/packages/wsrf/index.html

10)trtf、model4you和grf,参数模型的随机森林,如预测转换林、广义随机林等。
trtf
https://cloud.r-project.org/web/packages/trtf/index.html
model4you:
https://cloud.r-project.org/web/packages/model4you/index.html
grf:
https://cloud.r-project.org/web/packages/grf/index.html




神经网络 Neural Networks


1)nnet,执行单隐藏层前馈神经网络。

https://cloud.r-project.org/web/packages/nnet/index.html

2)RSNNS,提供Stuttgart Neural Network Simulator (SNNS)接口,该模拟器由斯图加特大学开发。

https://cloud.r-project.org/web/packages/RSNNS/index.html

3)deepnet、RcppDL和h2o,实现神经网络深度学习。其中,deepnet—前馈神经网络、限制玻尔兹曼机、深度信念网络、堆叠自动编码机,Rcppdl—去噪自动编码机、堆叠去噪自动编码机、限制玻尔兹曼机、深度信念网络和h2o—前馈神经网络、深度自动编码机。
deepnet:
https://cloud.r-project.org/web/packages/deepnet/index.html
RcppDL:
https://cloud.r-project.org/web/packages/RcppDL/index.html
h2o:

https://cloud.r-project.org/web/packages/h2o/index.html




贝叶斯学习 Bayesian


1)BayesTree、BART和bartMachine,贝叶斯可加回归树。
BayesTree:
https://cloud.r-project.org/web/packages/BayesTree/index.html
BART:
https://cloud.r-project.org/web/packages/BART/index.html
bartMachine:

https://cloud.r-project.org/web/packages/bartMachine/index.html

2)tgp,提供贝叶斯半参数非线性回归。

https://cloud.r-project.org/web/packages/bartMachine/index.html

3)MXM,实现了基于贝叶斯网络的变量选择。

https://cloud.r-project.org/web/packages/MXM/index.html

4)BDgraph,中实现了多元连续、离散、混合数据无向图模型的贝叶斯结构学习。

https://cloud.r-project.org/web/packages/BDgraph/index.html

5)ssgraph,基于尖峰和板先验(spike-and-slab Priors)的贝叶斯图形估计。

https://cloud.r-project.org/web/packages/ssgraph/index.html

6)naivebayes,贝叶斯分类器运用。

https://cloud.r-project.org/web/packages/naivebayes/index.html




支持向量机 Support Vector Machines


1)e1071,svm()函数提供R接口连接到LIBSVM库。

https://cloud.r-project.org/web/packages/e1071/index.html

2)kernlab,基于核函数的学习方法提供了一个灵活的框架,包括SUMs、RVMs、及其他科学系算法。

https://cloud.r-project.org/web/packages/kernlab/index.html

3)klaR,提供了R接口连接到SVMlight,实现1对多的分类。

https://cloud.r-project.org/web/packages/klaR/index.html

4)rdetools,对核特征空间的相关维度进行估计,也可进行模型的选择和预测。

https://cloud.r-project.org/web/packages/rdetools/index.html


注:以上R语言机器学习包未囊括全部机器学习命令,更多内容请关注R语言官网信息或点击左下角阅读原文









►往期推荐

回复【Python】👉简单有用易上手

回复【学术前沿】👉机器学习丨大数据

回复【数据资源】👉公开数据

回复【可视化】👉你心心念念的数据呈现

回复【老姚专栏】👉老姚趣谈值得一看


►一周热文

校招丨加入企研数据,未来更多奇遇!

工具&方法 | R资源网站“四件套”推荐:教程、制图、论坛和书籍

工具&方法丨关于交互项的那些事(二):画交互效应图原来如此简单

特别推荐丨老姚专栏:理解自然实验和DID方法——与现场实验比较的视角

数据呈现 | R制图:棒棒糖图,展示地区经济发展差异






数据Seminar

这里是大数据、分析技术与学术研究的三叉路口



作者:简华(何年华)审阅:杨奇明编辑:青酱





    欢迎扫描👇二维码添加关注    


    您可能也对以下帖子感兴趣

    文章有问题?点此查看未经处理的缓存