查看原文
其他

R中常用数据挖掘算法包

2015-12-22 刘顺祥 每天进步一点点2015

数据挖掘主要分为4类,即预测、分类、聚类和关联,根据不同的挖掘目的选择相应的算法。R语言博大精深,吸纳了来自各方的挖掘算法包,这些包都是由统计学家或是算法研究人员提供,我们可以站在这些伟人的肩膀上实现算法的应用。下面对常用的数据挖掘包做一个汇总:

连续因变量的预测:

stats包

lm函数,实现多元线性回归

stats包

glm函数,实现广义线性回归

stats包

nls函数,实现非线性最小二乘回归

rpart包

rpart函数,基于CART算法的分类回归树模型

RWeka包

M5P函数,模型树算法,集线性回归和CART算法的优点

adabag包

bagging函数,基于rpart算法的集成算法

adabag包

boosting函数,基于rpart算法的集成算法

randomForest包

randomForest函数,基于rpart算法的集成算法

e1071包

svm函数,支持向量机算法

kernlab包

ksvm函数,基于核函数的支持向量机

nnet包

nnet函数,单隐藏层的神经网络算法

neuralnet包

neuralnet函数,多隐藏层多节点的神经网络算法

RSNNS包

mlp函数,多层感知器神经网络

RSNNS包

rbf函数,基于径向基函数的神经网络


离散因变量的分类:

stats包

glm函数,实现Logistic回归,选择logit连接函数

stats包

knn函数,k最近邻算法

kknn包

kknn函数,加权的k最近邻算法

rpart包

rpart函数,基于CART算法的分类回归树模型

adabag包

bagging函数,基于rpart算法的集成算法

adabag包

boosting函数,基于rpart算法的集成算法

randomForest包

randomForest函数,基于rpart算法的集成算法

party包

ctree函数,条件分类树算法

RWeka包

OneR函数,一维的学习规则算法

RWeka包

JPip函数,多维的学习规则算法

RWeka包

J48函数,基于C4.5算法的决策树

C50包

C5.0函数,基于C5.0算法的决策树

e1071包

svm函数,支持向量机算法

kernlab包

ksvm函数,基于核函数的支持向量机

e1071包

naiveBayes函数,贝叶斯分类器算法

klaR包

NaiveBayes函数,贝叶斯分类器算分

MASS包

lda函数,线性判别分析

MASS包

qda函数,二次判别分析

nnet包

nnet函数,单隐藏层的神经网络算法

RSNNS包

mlp函数,多层感知器神经网络

RSNNS包

rbf函数,基于径向基函数的神经网络


聚类:

Nbclust包

Nbclust函数可以确定应该聚为几类

stats包

kmeans函数,k均值聚类算法

cluster包

pam函数,k中心点聚类算法

stats包

hclust函数,层次聚类算法

fpc包

dbscan函数,密度聚类算法

fpc包

kmeansruns函数,相比于kmeans函数更加稳定,而且还可以估计聚为几类

fpc包

pamk函数,相比于pam函数,可以给出参考的聚类个数

mclust包

Mclust函数,期望最大(EM)算法


关联规则:

arules包

apriori函数,Apriori关联规则算法


您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存