查看原文
其他

学习R语言,这本书必备。

R语言讲师果子 果子学生信 2022-06-07

尽管我写过R资源汇总,但是在掌握一点点R语言的知识后,有一本书必看。

当时没有强力推荐,是因为没有中文版。但是,现在,中文版也出来了。

R数据科学

神奇的是,他的英文电子版本是公开免费的,在这里

 http://r4ds.had.co.nz/ 

电子版的好处就是,可以复制代码,跟着同步练习。

这本书有多好呢?

我学习R语言3年,中间反复鼓起勇气,反复放弃,直到出现了三个男人才让我掌握R语言。

第一个男人,是Jimmy。

他组织线下课的时候,问现在还差个R语言讲师,谁能来? 我当时啥也不会,

同时也怕他们瞧不起,故作镇定地在群里说,我现在有点感觉了。

然后第二个男人登场了,是洲更,

他说,要不就让果子试一试。 健明说,好,就果子吧。

我说,我感觉没底气。 健明说,没关系,到时候我在下面给你当助教。 

我说,对对对,我就拍学员提问,回答不出来得多尴尬。 

洲更说,没关系,我帮你按住学员,保证他们提问的手在45度角的时候就被我按住。

最终,那一天,洲更和健明就像打地鼠一样地帮我圆了场

在上课之前,我碰到了第三个男人,就是这本书的作者,Hadley Wickham。

一开始的时候我一直把他跟著名励志大师尼克胡哲混淆,现在还是有点分不清 

在写R数据科学这本书之前,他还有一本书广为流传 

ggplot2:数据分析与图形艺术 这本书就是一个R包ggplot2的说明书,真正的猛人就是这个样子,写一个R包,发一篇文章,写一本书。 

这次的 R 数据科学 实际上是另外一个神包 tidyverse的说明书。

我在备课的那30天里,每天花费10小时,总共300小时算是进了R语言的门,这里面有80%的时间是在理解掌握 R 数据科学 这本书的内容。

他重新定义规范了数据处理每一步的流程,如何导入数据,如何清洗数据,如何可视化。

tidyr的出现,我跨过了一直不能理解的reshape,melt。

dplyr的出现,让数据处理像水一样灵动。

而这次300小时的备课也变成了我的传统,每一次上课,我都会重新准备一次,那段时间里是我R语言提高最快的时候。

我从不掩饰对他的喜欢,上海的线下课,我在课上不遗余力地推荐,他的书在数据处理时是通用的,我只是给他在生物领域的应用添加了注脚。 

他现在在Rstuido工作,社区里面的人常说,这个男人改变了R语言。

假如,我的R语言学习中有第四个男人,那应该是Y叔。

ggplot2如此精妙,导致我们只能用,不能写,而Y叔的出现,他对这些技能的出神入化的使用,把神技带到人间,

我也尝试写点R可视化R包,最终从鼓足勇气到彻底放弃。

假如哪一天我写出可视化的R包,那一定是Y 叔的功劳。在那之前,我们用用大神的R包就好。有了clusterprofiler为什么还要用网页工具呢?

这也是我授课的观点:

无论你是申请基金还是发表文章,漂亮的图表永远是刚需,但是却是初学者最不应该学的。初学者要学的仅仅是调整数据的能力。把所有的数据调整到 R 包需要的格式,足矣。

而调整数据的能力从哪获得呢?当然是看这本书啊

今晚我就要看这本中文书,我这个月都住在宾馆里,今天这个特殊的日子,声浪一定是此起彼伏,不可开交,

还好,我准备了降噪耳机。

祝大家情人节快乐。


您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存