你早晚都得学习R语言
生物信息学将生物学问题转换为计算机计算问题,而随着测序量累积越来越多,计算机计算问题又变成了统计学的问题。所谓“贾人夏则资皮,冬则资絺,旱则资舟,水则资车,以待乏也”,如何才能做到未雨绸缪,那就赶快学习R语言吧。
为什么选择R语言
R软件是一款非常优秀的数据分析软件,它是一种为统计计算和绘图而产生的语言和环境,也是一套开源的数据分析解决方案,选择学习R语言是一个非常好的选择。市面上也有很多其他流行的统计和绘图软件,例如微软公司的Excel,SAS,IBM公司的SPSS,Stata,S-PLUS以及Matlab等。这些软件中,很多都是商业软件,需要支付昂贵的费用才可以使用,而且一般统计软件价格都非常贵,投入成千上万美元都是有可能的,而R语言则是免费的。R是一个全面的统计研究平台,提供了各式各样的数据分析技术,几乎可以完成任何类型的数据分析工作,并且R拥有顶尖的绘图功能,可以绘制非常专业精美的图形。
R语言历史
R语言是S语言的一种实现。S语言是由贝尔实验室在1976年开发的一种用来进行数据探索、统计分析、作图的解释型语言。现在的S语言已经进化为商业版的S-PLUS软件,它基于S语言,并由MathSoft公司的统计科学部进一步完善。那么已经有了S语言,为什么又要开发R语言呢。因为S-PLUS是商业软件,价格不菲,一般统计软件价格都非常贵,很多从事科学研究的人,不愿意为了发表一篇论文,使用一次,就支付费用,或者为了教学就去购买软件,这样显然不划算。后来,在1991年来自新西兰奥克兰大学的Robert Gentleman 和 Ross Ihaka 及其他志愿人员开发了一个R语言系统。
因为这两个开发者的名字都是以字母R开头,所以就叫做R语言。1995年, Martin Michler 说服Ross 和Robert在GNU这个许可证下授权,这使得R成为了一个免费的软件。
专门为生物计算而生的语言
其实R的开发之一的,Robert Gentleman,他并不是一个统计学家,也不是计算机科学家,而是生物学家,当初开发R语言,只是想用来做生物统计。所以,R最开始就是用来做生物统计(其实SAS软件最开始也是用来做生物统计的),这个人后来又开发Bioconductor包,专门用来做生物计算。Bioconductor 是建立在R语言环境上的,用于生物信息数据的注释、处理、分析及可视化工具包的总集,由一些列R扩展包组成。目前Bioconductor可以做大量的生物数据分析工作,包括芯片数据,RNAseq数据,Chipseq,流式细胞仪数据,基因功能注释,富集等等分析。
免费的R语言课程
R语言绘图课程
R语言不仅能够方便处理生物数据,而且具有强大的数据可视化功能,能够直接绘制出版级别的科学文献图。本课程利用R语言绘制生物信息数据分析常用的图,包括散点图,条形图,箱线图,韦恩图,火山图,热图,曼哈顿图,GC-depth图,COG功能注释图,KEGG功能注释图,GO条目等。
R语言线下培训课程
时间:2019年4月20~4月24日(五天)每天早上8:30~17:00
上课地址:北京市海淀区辰茂鸿翔酒店(地铁10号线牡丹园地铁站附近)
请自带电脑(windows与mac系统均可),提供午餐。
---------- END ----------
(更多精彩内容,欢迎关注公众号)
您可能还会感兴趣的
手把手教你生信分析平台搭建专栏合集
生物信息重要资源站点合集
不会编程,如何进行批量操作
一个人全基因组完整数据分析脚本
一个细菌基因组完整分析脚本
如何在Linux下优雅的装X
2019,送给大家一份新年礼物
生物学才是终极学科
点击“阅读原文”,直接报名观看。