R语言中描述统计量方法集锦
1. summary()函数
可以获得最小值、最大值、四分位数和均值,以及因子向量和逻辑型向量的频数
2. misc包中的describe()函数
可返回变量和观测的数量、缺失值和唯一值的数目、平均值、分位数,以及五个最大的值和五个最小的值
3.psych包中的describe()函数
psych包中的describe()的函数,可以计算非缺失值的数量、平均数、标准差、中位数、截尾均值、绝对中位差、最小值、最大值、值域、偏度、峰度和平均值的标准误
4.pastecs包中的stat.desc()的函数
使用格式为:
stat.desc(x,basic=TRUE,desc=TRUE,norm=FALSE,p=0.95)
其中的x是一个数据框或时间序列。若basic=TRUE(默认值),则计算其中所有值、空值、缺失值的数量,以及最小值、最大值、值域,还有总和。若desc=TRUE(默认值),则计算中位数、平均数、平均数的标准误、平均数95%的置信区间、方差、标准差以及变异系数。若norm=F(默认值),则不返回正态分布统计量,包括偏度和峰度(以及它们的统计显著程度)和Shapiro–Wilk正态检验结果
5.str()函数
显示对象的数据结构及内容,可以查看数据框中每个变量的属性
6. attributes()函数
可以提取对象除长度和模式以外的各种属性
7.aggregate()函数
可以通过每次调用,获得平均数、标准差这样的单返回值函数,无法一次返回若干个统计量
8.by()函数
格式为:by(data,INDICES,FUN),其中data是一个数据框或矩阵,INDICES是一个因子或因子组成的列表,定义了分组,FUN是任意函数。
9.doBy包中的summaryBy()函数
10.psych包中的describe.by()函数