《R语言科学编程及仿真》读书笔记
以前有人问我推荐R语言入门的书,讲真我还真想不起来入门有什么好书,至少我好像没遇到过。我在2006年看的第一本R语言的书在《听说你想学R?》一文中已经有介绍过,看了那本天书,让我怀疑人生。整个硕士阶段我基本上都是用perl的。
现在大家所熟悉的东西,和我十几年前的情况是完全不同的,比如说现在Rstudio似乎是标配,而且很多人甚至于把Rstudio和R等同起来,比如说ggplot2
中的theme
主题系统,是从当年一个叫opts
的东西演变而来的,再比如说当年我写第一个R包(《匆匆那年,如一场不真实的梦。》),文档要手工写LaTeX代码,因为当年支持文学编程的roxygen包还没出现。
现在很多R语言方面的书,当年都不存在,而现在流行的书,我基本上也没看。所以真心是无从推荐。当时基本上靠看CRAN网站上的manuals入门,入门其实从来就不是问题,只要你愿意花时间,总是能够入门的。难的是由初级进入中级,没有好的书,没有人指导,没有自己死磕,很多时候就停留在入门阶段,而这个阶段的书实际上特别难找,有的是各种各样教人入门的书,也有的是各种各样专题式的高级的书,而中间往往断层,没有衔接。我印象中这一阶段对我有帮助的两本书是《Introduction to Scientific Programming and Simulation Using R》和《R Programming for Bioinformatics》。第一本书我做了笔记,分享给大家,然而阅读及转发量惨不忍睹,虽然如此,我还是全部更新完,保留一个记录给同样阅读这本书的小伙伴,给想告别入门阶段的小伙伴一个参考。
第一部分是R编程入门; 第二部分是数值计算,主要是解方程,求积分和优化;第三部分是概率和统计,主要讲概率、随机变量等概念和参数估计;第四部分是simulation,主要讲Monte Carlo积分和方差降低。
这本书非常值得花时间去学习,入门书太多,而进阶的书太少,这是难得的一本让你进阶的书。像以前写的《SIR Model of Epidemics》模型,学了这本书都应该不在话下,《一文解决RT-PCR的统计分析》中使用的permutation test也不在话下,GSEA分析的计算过程你也能够理解了。更难能可贵的是书中的代码和数据,你都是有的,因为作者打了个R包在CRAN上。
笔记目录
Antithetic sampling:https://gist.github.com/1938586