查看原文
其他

R语言笔记5:控制结构

圈圈 宏基因组 2022-03-28

R语言基础系列前情提要:

Control Structures in R

R语言中控制结构可以用来控制程序的执行流程

常见控制结构的命令:

  • if and else: 测试逻辑条件

  • for: 用于执行固定次数的循环

  • while: 用于在某个条件成立时执行循环

  • repeat: 执行无限循环

  • break: 终止并跳出循环

  • next: 跳过循环中的当前迭代

  • return: 从函数中退出

If-else

如果条件成立,程序就做某件事

否则(另一种条件下)。程序做另一件事

  1. if(<condition>) {

  2.        ## do something

  3. }

  4. else {

  5.        ## do something else

  6. }

Else不是必须的,如果只需要在某条件成立时执行某个任务,那么只要使用if语句就可以了

  1. if(<condition>) {

  2.        ## do something

  3. }

  4. ## Continue with rest of code

如果条件不止一个/不止两个的时候,可以添加一个/多个 elseif语句,但最后必须以 else结尾:

  1. if(<condition1>) {

  2.        ## do something

  3. } else if(<condition2>)  {

  4.        ## do something different

  5. } else {

  6.        ## do something different

  7. }

取随机数字举例,y的取值随x的取值而定:

  1. ## Generate a uniform random number

  2. x <- runif(1, 0, 10)

  3. x

  4. if(x > 3) {

  5.  y <- 10

  6. } else {

  7.  y <- 0

  8. }

上面的代码也可以写成下面的形式,先给变量y赋值,这种写法的好处是更加明确的看出整个if结构是在给y赋值:

  1. y <- if(x > 3) {

  2.  10

  3. } else {

  4.  0

  5. }

For 循环(For loop)

for循环是R中最常见的循环运算符,基本思路是先要设定一个循环下标,通常命名为 i,循环下标通常会代表一个整数数列中的每一个数字,或列表中的每一个对象等等。

最简单的例子如下,运行后将依次输出1-10这十个整数:

  1. for(i in 1:10) {

  2.  print(i)

  3. }

依次打印x中的每一个元素,运行后就会依次输出 "a", "b", "c", "d"四个字符对象:

  • 第一种方法是将循环向量和向量x的长度相对应:

  1. x <- c("a", "b", "c", "d")

  2. for (i in 1:4) {

  3.  print(x[i])

  4. }

  • 第二个方法,使用 seq_along()函数,即,输入一个向量,之后它就会创造一个与该向量等长的整数数列。因此上面的例子可以改写成,在我们不知道x的向量长度时,可以使用这种写法:

  1. x <- c("a", "b", "c", "d")

  2. for (i in seq_along(x)) {

  3.  print(x[i])

  4. }

  • 第三个方法,下标变量 letter,这个变量的本意就是一个下标,会从向量本身取值,它可以从任意向量中提取元素,因此可以写成:

  1. x <- c("a", "b", "c", "d")

  2. for (letters in x) {

  3.  print(letters)

  4. }

ps. 如果你的for循环表达式只有一行,那么可以省略掉大括号 {},直接写道 for的后面:

  1. for (letters in x) print(letters)

嵌套for循环(Nested for loop)

把一个for循环放到另一个for循环的里面。

比如,有一个二维矩阵,你想先做一个行循环,再做一个列循环,这时就需要做一个嵌套for结构才能打印出所有矩阵中的元素。

我们设置 i为外层循环下标, j为内层循环下标:

  1. > x <- matrix(1:6, 2, 3)

  2. > x

  3.     [,1] [,2] [,3]

  4. [1,]    1    3    5

  5. [2,]    2    4    6

  6. > for (i in seq_len(nrow(x))) {

  7. + for (j in seq_len(ncol(x))) {

  8. + print(x[i,j])  

  9. + }  

  10. + }

  11. [1] 1

  12. [1] 3

  13. [1] 5

  14. [1] 2

  15. [1] 4

  16. [1] 6

While 循环

While循环有一个逻辑表达式,循环是按照这个逻辑表达式的值来反复运行的。

举个栗子,

设定一个计数标量 count,初始值为0,当技术变量的值小于10(逻辑表达式)时,运行输出变量 count就在之前的基础上 +1,一旦 count的值达到10,循环停止

  1. count <- 0

  2. while(count < 10) {

  3.         print(count)

  4.  count <- count + 1

  5. }

注意:你需要确保逻辑循环表达式的值是可以达到终止状态的,否则就会无穷无尽的循环下去。

使用逻辑运算符

再举个栗子,设计一个小型随机游走的程序:

首先赋值z=5,然后运行while循环,当z处于3~10中间时,进入循环,循环中抛硬币,硬币是随机数1和0.5,在嵌入if循环,z的值会根据硬币取值变化而变化,结束时间不定。

  1. z <- 5

  2. while (z >= 3 && z <= 10) {

  3.  coin <- rbinom(1, 1, 0.5)

  4.  if(coin == 1) {  ## random walk

  5.    z <- z + 1

  6.    } else {

  7.    z <- z - 1

  8.    }

  9. }

repeat循环

这是一个无限循环结构,退出的方法是 break(在某个点强制退出)。

比如,当你想计算两个值何时达到无限接近,需要通过算法不断循环,直到逼近你设置的容差(允许范围)

  1. x0 <- 1

  2. tol <- 1e-8

  3. repeat {

  4.  x1 <- computeEstimate()

  5.  if(abs(x1 - x0) < tol) {  ## Close enough?

  6.    break

  7.  } else {

  8.    x0 <- x1

  9.  }

  10. }

(这里的 computeEstimate()是需要事先设定的,如果这有这段这个代码的话跑不通)

注意,repeat循环风险很大,因为没硬性规定何时退出,有可能运行时间非常长,所以不建议直接使用

break函数

break用来完全退出循环

  1. for(i in 1:100) {

  2.      print(i)

  3.      if(i > 20) {

  4.              ## Stop loop after 20 iterations

  5.              break  

  6.      }    

  7. }

next和return函数

nextreturn函数是一种控制结构。

next可用在任何一种循环中,跳过某一段循环。例如,在1-100的迭代循环中,想要跳过前20个,可以用这种方式:

  1. for(i in 1:100) {

  2.        if(i <= 20) {

  3.                ## Skip the first 20 iterations

  4.                next                

  5.        }

  6.        ## Do something here

  7. }

return主要用于退出函数,它会结束整个函数并且返回一个数值。

最后,Peng提到,这些控制结构最好用于编写程序的过程中,而在命令行和交互作用来说有其他的循环函数,如apply()等一系列函数,这些在这里暂且不提,以后会讲到。

参考资料:

  1. https://bookdown.org/rdpeng/rprogdatascience/R Programming for Data Science

  2. 《R语言实战》 Robert I. Kabacoff

快快和我一起上车,请关注:生信小白学习记


猜你喜欢

写在后面

为鼓励读者交流、快速解决科研困难,我们建立了“宏基因组”专业讨论群,目前己有国内外1300+ 一线科研人员加入。参与讨论,获得专业解答,欢迎分享此文至朋友圈,并扫码加主编好友带你入群,务必备注“姓名-单位-研究方向-职称/年级”。技术问题寻求帮助,首先阅读《如何优雅的提问》学习解决问题思路,仍末解决群内讨论,问题不私聊,帮助同行。

学习16S扩增子、宏基因组科研思路和分析实战,关注“宏基因组”

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存