查看原文
其他

R语言学习效果自测200题

王通 基因学苑 2023-08-18

知乎上有云:“你多学一样本事,就少说一句求人的话”,这里我们列出了我们R语言与生物信息专题培训班的自测部分,可以测试一下自己对R语言的掌握程度,如果你觉得自己很多问题都还不清楚,欢迎参加来和我们一起学习R语言。

第一部分:R语言基础

  1. 什么是R语言,统计软件还是编程语言?

  2. 了解R语言的发展历史。

  3. 了解R语言在生物信息分析中的应用。

  4. 了解R语言的优点。

  5. 了解R语言的缺点。

  6. 了解学习R语言的方法。

  7. 了解数据分析的六个过程。

  8. 能够访问R语言的官网。

  9. 能够独立安装R语言软件。

  10. 了解32位版本与64位版本的区别。

  11. 了解Rstudio的作用。

  12. 能够独立安装Rstudio。

  13. 能够对Rstudio进行设置,包括主题,字体,默认镜像站点等。

  14. 熟悉Rstudio的各个窗口的作用。

  15. 能够修改默认R语言的编码格式。

  16. 能够处理中文乱码的问题。

  17. 能够利用Rstudio创建Project。

  18. 了解windows目录结构的书写方式。

  19. 能够在Rstudio中编辑和运行R脚本。

  20. 能够使用ctrl+shift+H修改默认工作目录。

  21. 了解R函数的特点及使用方式。

  22. 熟悉选项和参数的定义。

  23. 熟悉两种R的运行方式。

  24. 能够找到R的历史记录。

  25. 了解什么是R语言的包。

  26. 能够通过R TaskView查找需要的软件包。

  27. 能够修改R镜像站点为国内镜像站点。

  28. 掌握如何安装R语言的包。

  29. 掌握如何加载R语言的包。

  30. 能够找到R包的安装目录。

  31. 能够查找R中已安装的包。

  32. 能够将一台设备的R包迁移到另外一台设备。

  33. 能够加载已安装的包。

  34. 能够查看R包的帮助文档。

  35. 了解什么是vignette形式文档。

  36. 能够取消已加载的R包。

  37. 能够删除已安装的包。

  38. 能够升级低版本的包。

  39. 能够查看R包中所有的函数。

  40. 了解bioconductor项目。

  41. 了解R包与bioconductor包的区别。

  42. 了解bioconductor包的分类。

  43. 能够修改bioconductor镜像站点为国内站点。

  44. 掌握bioconductor包的管理,包括查找,安装,卸载,升级等。

  45. 了解bioconductor中workflow的重要作用。

  46. 能够修改R语言的默认行为。

  47. 修改R语言与bioconductor默认的镜像站点。

  48. 设置常用R包为启动后自动加载。

  49. 修改默认提示符。

  50. 熟悉R语言交互环境。

  51. 能够使用tab自动补齐。

  52. 会使用ctrl+L清空屏幕。

  53. 能够使用esc终止命令。

  54. 能够使用alt+-快速生成赋值操作符。

  55. 能够使用上下方向键查找历史记录。

  56. 了解每一个函数都需要小括号。

  57. 熟悉R中对象object的定义。

  58. 能够查看当前工作环境中有哪些对象。

  59. 能够删除当前环境中的对象。

  60. 能够解决“object not found”的错误。

第二部分:文件操

  1. 了解R数据分析中常用的集中数据格式。

  2. 能够读写tab分割格式文件。

  3. 能够读写csv格式文件。

  4. 能够读写excel格式文件。

  5. 能够使用head(),tail(),View()函数查看读入内容。

  6. 能够读写RDS与Rdata文件。

  7. 了解.Rdata文件的作用,并能够找到.Rdata文件。

  8. 能够快速调用R内置的数据集。

  9. 掌握R语言中不同括号的作用。

第三部分:R语言数据结构

  1. 了解R语言中常见的数据类型。

  2. 了解R语言中常用的数据结构。

  3. 掌握R中向量这种数据结构。

  4. 能够通过c()函数创建向量。

  5. 能够通过seq()函数生成连续向量。

  6. 能够通过rep()函数生成重复向量。

  7. 能够通过paste()函数生成组合向量。

  8. 能够绘制人染色体长度分布图。

  9. 掌握Rcolorbrewer包的用法。

  10. 了解向量化操作的概念。

  11. 能够进行向量的运算。

  12. 能够通过matrix()函数创建矩阵。

  13. 能够快速取出矩阵的任意行与列。

  14. 掌握热图的绘制方法。

  15. 掌握pheatmap包的使用。

  16. 掌握不同SV突变类型分布图的绘制。

  17. 能够通过data.frame()函数创建数据框。

  18. 了解矩阵与数据框之间的差别。

  19. 能够取出数据框的任意行与列。

  20. 能够通过$符号索引数据。

  21. 能够利用R实现Excel vlookup函数的功能。

  22. 了解因子的定义,包括levels与labels。

  23. 了解因子在数据分析中的重要作用。

  24. 能够重新修改因子的水平levels和标签labels。

  25. 了解列表这种数据类型。

  26. 能够通过list()函数创建列表。

  27. 能够索引列表中的各个任意元素。

  28. 了解时间序列这种数据类型。

  29. 掌握R中缺失数据的表示方式。

  30. 了解缺失数据产生的原因。

  31. 能够删除数据中的缺失数据。

  32. 了解插值法等缺失数据的处理方法。

  33. 了解类这种数据类型。

第四部分:数据转换

  1. 给定一个数据集,能够判断出其数据类型。

  2. 给定一个数据集,能够修改其中任意部分的值。

  3. 能够读各种数据之间进行相互转化。

  4. 给定数据集,能够进行随机性抽样。

  5. 了解有放回抽样与不放回抽样的差别。

  6. 了解随机数种子的作用。

  7. 给定数据集,能够根据任意列进行排序。

  8. 了解sort()函数与order()函数之间的差别。

  9. 给定数据集,能够根据两个条件进行排序。

  10. 给定数据集,能够将其中满足特定条件的值筛选出来。

  11. 给定基因的gff格式文件,能够绘制基因长度分布图。

  12. 了解R中apply家族函数的用法。

  13. 给定二维数据,能够单独按行或者按列进行计算。

  14. 能够分组进行统计。

  15. 了解tidyr与dplyr函数的一些用法。

第五部分:统计检验

  1. 了解零假设检验的定义。

  2. 了解假阳性与假阴性的定义及其计算。

  3. 了解p值的定义。

  4. 掌握频数的计算方法。

  5. 掌握独立性检验的意义。

  6. 掌握卡方检验的方法及意义。

  7. 掌握fisher精确检验的方法及意义。

  8. 掌握t检验的方法及意义。

  9. 能够利用apply函数进行批量t检验。

  10. 掌握q值的定义及意义。

  11. 掌握非参检验方法wilcox检验。

  12. 掌握相关性检验的定义及意义。

  13. 能够计算相关性系数。

  14. 能够进行相关性检验。

第六部分:数据挖掘

  1. 了解线性回归的定义。

  2. 掌握线性回归中公式的写法。

  3. 掌握线性回归结果中各个指标的含义。

  4. 了解R方的定义与意义。

  5. 能够评估回归模型的好坏。

  6. 掌握残差的定义。

  7. 能够对基因组大小与基因个数的进行建模。

  8. 了解购物篮分析。

  9. 掌握利用机器学习预测乳腺癌的案例。

  10. 了解建模中的训练集与验证集。

  11. 能够将数据集抽样成训练集与验证集。

  12. 掌握广义线性回归glm()函数的使用。

  13. 能够根据模型对新数据进行预测。

第七部分:R语言与生物信息绘图

  1. 了解R语言的四大绘图系统。

  2. 了解R语言的绘图设备。

  3. 能够将绘制的图形保存到pdf文件中。

  4. 能够将绘制的图形保存为png文件。

  5. 能够设置图形默认的分辨率。

  6. 了解位图与矢量图的定义。

  7. 能够关闭绘图设备。

  8. 掌握高级绘图与低级绘图的区别。

  9. 掌握基本绘图参数。

  10. 了解R的一些绘图扩展包。

  11. 掌握绘制饼图函数pie()的用法。

  12. 掌握绘制箱线图函数box()的用法。

  13. 掌握绘制小提琴vioplot)的用法。

  14. 了解R中韦恩图的绘制方法。

  15. 了解R中曼哈顿图的绘制方法。

  16. 掌握R中地图的绘制方法。

  17. 掌握ggplot2绘图语法。

  18. 理解ggplot2中映射的概念。

  19. 能够重复RGraph gallery网站中的案例。

第八部分:R语言分析RNAseq数据

  1. 了解转录组和RNAseq的定义。

  2. 掌握RNAseq分析的基本流程。

  3. 了解RNAseq的定量方法。

  4. 掌握RPKM,FPKM,TPM的定义。

  5. 重复RNAseq分析的案例。

  6. 掌握DESeq2包的使用。

  7. 能够评估组间差别与组内差别。

  8. 了解FoldChanger的定义及意义。

  9. 了解FDR的定义与意义。

  10. 能够筛选到差异表达基因。

  11. 对差异表达基因进行格式化。

第九部分:基因功能注释以及富集分析

  1. 能够正确安装clusterProfiler包。

  2. 能够正确安装GO,KEGG,DO等包。

  3. 能够找到clusterProfiler的文档。

  4. 了解基因功能注释的原理。

  5. 了解常见的一些基因ID的表示方法。

  6. 给定基因ID,能够转换为另外一种基因ID。

  7. 给定基因ID,能够进行GO功能注释与富集。

  8. 能够可视化GO功能富集分析的结果。

  9. 给定基因ID,能够进行KEGG功能注释与富集。

  10. 能够可视化KEGG功能富集分析的结果。

第十部分:WGCNA数据挖掘

  1. 了解WGCNA的定义与意义。

  2. 了解WGCNA分析对样品数目的要求。

  3. 能够安装WGCNA包。

  4. 能够准备好输入文件的FPKM表达矩阵。

  5. 能够将表达矩阵转换为邻接矩阵。

  6. 能够将邻接矩阵转换为拓扑矩阵。

第十一部分:TCGA数据挖掘

  1. 了解TCGA项目。

  2. 了解TCGA数据的类型以及组织方式。

  3. 了解TCGA数据下载的几种方式。

  4. 熟悉TCGA官网。

  5. 掌握TCGA数据命名的规则。

  6. 能够下载样品的mainfest文件。

  7. 能够下载样品的元数据metadata。

  8. 掌握gdctools工具的使用。

  9. 能够安装TCGAbiolinks包。

  10. 掌握TCGAbiolinks包的使用。

---------- END ----------

(添加作者微信,请注明单位姓名)



您可能还会感兴趣的

生物信息暑期班(北京站)开始报名
基因学苑文章列表(201906)

上传数据,直接分析,1T内存服务器来了
手把手教你生信分析平台搭建专栏合集
生物信息重要资源站点合集
不会编程,如何进行批量操作
一个人全基因组完整数据分析脚本
一个细菌基因组完整分析脚本
如何在Linux下优雅的装X

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存