R语言的各种统计分布函数，你应该了解的都在这！

Original 生信技能树生信技能树 2022-08-10

收录于合集

#小编“十年” 7 个

#R语言 105 个

正在学习R语言统计学的小伙伴，可能会被各种专有名词所困扰，小编为大家梳理了一下，话不多说，进入正题。

下图是截取自[《An Introduction to R》包含了R中所有的概率函数

1.简单介绍：

R中的概率函数有统一的命名格式：即前缀+分布函数名

d 表示密度函数(density);
p 表示分布函数；
q 表示分位数函数，能够返回特定分布的分位数（quantile）；
r 表示随机函数，生成特定分布的随机数。

2.举个例子

正态分布的意义：理论上可以证明如果把许多小作用加起来看做一个变量,那么这个变量服从正态分布

以正态分布（函数norm）公式：

其中是均值，是标准差

调用形式：

norm(mean,sd)

随机分布函数调用：

rnorm(n,mean=0,sd=1)

参数解释：

mean 均值
sd 标准差
后两个参数如果不填则默认为0,1。

密度函数调用

dnorm(x,mean,sd)

参数解释：

mean 均值
sd 标准差
后两个参数如果不填则默认为0,1。

画出正态分布概率密度函数的大致图形：
x<-seq(-3,3,0.1) # 注意：plot中的x,y要有相关关系才会形成函数图。 plot(x,dnorm(x))

分位数函数调用形式：

qnorm(p,mean,sd)

参数解释：

p为概率值
mean 均值
sd 标准差
后两个参数如果不填则默认为0,1。
如qnorm(0.05)=-1.644854,即x<=这个数的累计概率(-1.644854)小于0.05

分布函数的调用：

# pnorm()默认的参数与dnorm()一样，都是标准正态分布，即平均数为0，标准差为1的正态分布
pnorm(0)
# [1] 0.5

3.sigma法则：

对于正态分布的x，x取值在(mean-3sd,mean+3sd)几乎就是极端值啦，因为pnorm(3)-pnorm(-3)=0.9973002，这个概率外的事情基本上不可能发生！

以上就是本期的主要内容，以正态分布为例子，我们学习了4个函数的使用。感兴趣的小伙伴总结一下其他的概率分布函数，举一反三，触类旁通，如果能加上一些生物信息学案例就更好了。

下面附上R语言内置数据包供大家练习使用。

后起之秀奔涌而至，欢迎大家在《生信技能树》的舞台分享自己的心得体会！

上面是新晋小编“十年”的稿件

警察殴打打人学生，舆论撕裂的背后

你手放哪呢，出生啊

薅广电羊毛！100元话费实付94.6元，还有电费96.9充100元！招团长~

警察踢打校园欺凌者：当事人不愿返校，派出所拒收锦旗

疯传！广州地铁突发！警方介入

R语言的各种统计分布函数，你应该了解的都在这！

1.简单介绍：

2.举个例子

随机分布函数调用：

密度函数调用

分位数函数调用形式：

分布函数的调用：

您可能也对以下帖子感兴趣

警察殴打打人学生，舆论撕裂的背后

你手放哪呢，出生啊​

薅广电羊毛！100元话费实付94.6元，还有电费96.9充100元！招团长~

警察踢打校园欺凌者：当事人不愿返校，派出所拒收锦旗

疯传！广州地铁突发！警方介入

生成图片，分享到微信朋友圈

R语言的各种统计分布函数，你应该了解的都在这！

1.简单介绍：

2.举个例子

随机分布函数调用：

密度函数调用

分位数函数调用形式：

分布函数的调用：

您可能也对以下帖子感兴趣

你手放哪呢，出生啊