解螺旋公众号·陪伴你科研的第2911天
五一假期马上就来了,大家都收到「不放假通知」了吗?就在刚刚,我收到了导师的五一不放假通知,内容如下:
同学们好!五一假期就要来了,我们自然是不放假。为了丰富大家在封控期间的生活,提升大家的科研生活质量,完善我们临床医学研究生的SCI统计绘图水准,我费了九牛二虎之力,为大家请来了一位R语言领域的大咖,届时他将为大家开展一场为时5天5夜的R语言线上讲座。
很多同学一定想问,时间为啥定在五一?原因是我担心大家五一期间任务不够紧凑,顺便弥补下大家失去五一假期的失落感。请大家务必抓住这次大好学习机会,愿这个五一过后,大家不再上交给我辣眼睛的论文图片!
看完导师的通知,我和同门集体为导师的贴心落泪了!五一终究是没了!虽说早就知道医学研究生就是这样的苦逼,但当幻想被打破
三分钟过去了,没有人提出任何异议~大家纷纷回复导师:“太感谢导师了,R语言再难,我们五天之内也能学会!”以下是导师发我们的R语言讲座资料,我决定送给所有失去2022年五一假期的硕博生们。请大家快乐食用!
很多人问,世界上那么多好用又好学的软件,医学人为啥必学R语言呢?统计方面,这方面是R的核心大本营,R语言最初就是统计学家开发的,所以R的社区中,有着非常多的统计学家开发的R包。如果你有在统计方面领域的需求,基本都能在R中找到相对于的包,这方面,Python是远不及R的。可视化方面,这方面也是R的长处,ggplot2包,作图能达到专业级别的水准,Python中的库也不弱,matplotlib,seaborn,pyecharts等等。但是总的来说,R语言在可视化方面,要略胜Python一筹。如果你是医学或者生信专业的,R语言绝对是必学的。如果你是做数据科学领域的,R绝对是你的必备技能之一,相信我,不然我也不会学R了。很多人问,那只学R语言可以吗?我内心OS:左手Python,右手R,小孩子才做选择,成年人选择全安排上!临床医生科研本就薄弱,做实验攒数据劳心劳力,梦想升主治医师,评职称拿基金全要拼SCI文章!好不容易得到测序数据,聚类分析,富集分析还是不会做,想用R语言分析基因芯片和TCGA数据,但是不知道如何入手?想做高水平的科学数据分析图,但是连个热图都画不出来?我用我的医学实战经历告诉大家,想要高效解决以上问题,没有一手溜到起飞的R语言拯救科研菜狗真不行!但凡对R语言稍有涉猎的各位,都应知晓R语言中强大的安装包(Package)。
它就像R语言这个游戏里要用到的装备,种种装备都各自有特定的功能(功能就是函数,即Function)——有专用于数据分析的包,也独属于画图的包。所以要在R这个战场上玩转数据,就得配上不同的装备。
ggplot2
ggplot2是最常用、最受用户们喜爱的作图工具包了,被誉为数据作图的标杆。它做出的图不仅漂亮,而且可以涵盖很多复杂的信息。网上也有大量关于它的教程,学习资源很丰富。
gridExtra
ggplot2的缺点之一就是不能像自带的graphics基础包那样,把几张图拼成一组图。而gridExtra就可以解决这个问题,把ggplot2做出来的漂亮的图组织到一张大图里。
lattice
lattice经常被拿来和ggplot2相提并论,这两者也是选择困难户的纠结点。ggplot2做出来的图更漂亮,但它入门难啊~lattice则适合入门选手,作图速度较快,还能进行三维绘图,这是ggplot2不具备的。
lme4 (或者nlme)
如果你常做一些复杂的数据,实验分了好几个层,有好多亚组,亚组下面还有亚亚组,比如要做好几种细胞,检测好几个指标,每个指标还有不同的观察时间点……此时lme4包就可以比较轻松地把这些数据组织起来。nlme也一样,选一个就好。
forecast
比较适合分析时间序列数据。
zoo
forecast里有很多好用的内置函数,但有时候还需要更简单易用的计算移动平均、移动标准差的函数,这时zoo会是个很好的补充。
spatstat
空间分析神器,比如某种疾病发病率在地理空间上的分布特征等等。
dplyr可以很好地把数据随意分解、整合。这个包可能也比较难上手,但熟悉之后,就像老司机开车一样形成本能。对于做基因组或芯片分析、阵列、基因流等等的小伙伴,Bioconductor是个好选择。它还有个很活跃的用户社区,可获得及时反馈,每年更新2次,还有丰富的学习资源,比如http://www.bioconductor.org/help/course-materials/这里的一系列教程。虽然一开始说到的数据可示化也是展示的一种,但这里要说的是,通过更丰富的方式来展示其他多种内容。除了数据分析成果,还有分析过程中各种代码、运行过程、文本说明等,都可以通过knitr生成网页、PDF、幻灯片等形式展示出来。比较适用于教学、报告等场合。shiny包也像knitr一样可以做出漂亮的网页,此外还可以快速搭建动态的交互网页App。它一大优势就是不需要学习其他网页编程语言(CSS、JS等),纯靠R。字符串处理神器。可在作图、网页编辑、数据清洗等操作中起到很好的辅助作用,对字符串进行拼接、匹配、变换等。以上都是一些比较出名、经常用到的包,尤其是Bioconductor、ggplot2、lattice和dplyr,可以先装上以备不时之需。我担心的不是你有没有炫酷装备,而是会不会中途被劝退!
很多自学的医学小白,在入门R语言的路上,会被一个又一个大大小小的坑劝退,于是,我总结了避免半途而废的R语言学习思路,请大家自觉按以下实战经验前行,具体解法就是:把学习R语言当成基础语法+应用训练的闯关游戏,分阶段完成任务,坚持到最后一关,就是人森赢家。首先准备几本写R基础语法的书,例如《R语言实战》和《R语言医学数据分析实战》,书不在多,不吃灰就行。老老实实照着书本,把书上涉及到的代码一一敲入电脑——运行——出错——仔细查看代码哪里错了——错误自己先找找看,不行就去各大社交网站,学习小组,请教大佬。按照这个基础步骤,直到运行正常,你就过了一个关卡。在查错这一步,一定要仔细记笔记,笔记按照R的基础语法来记,例如R语言的编辑器,R语言的数据类型,R语言的循环,函数构建等,这个周期估计会很漫长且枯燥。但是,记笔记这一步非常重要,不要忽视!如果涉及到一些统计学的东西看不懂,就跳过,先不看,可以避免中途被劝退的概率。过了这一关,就到了对R语言的实战环节,我发现很多自学小白,即使跟着基础R语言教程学会了R的语法,也不知道如何用R将医学领域的一些思想变成代码。搞懂它,但不会用它来书写也不行。实战环节,可以从网上搜集一些R语言实际运用的案例,例如GEO数据挖掘,把这些教程从头到尾自己敲一遍,做好笔记,涉及到的R语言知识点,就去之前记的笔记里寻找,如果笔记里没有相关,就补充上去,遇到不懂的函数,一定要勤看文档。恭喜你坚持到现在克服了一个又一个大大小小的BUG,掌握了必备知识点。如果还想精进,就好好研究一下,如何用R进行统计学分析,把统计学原理搞懂。建议去一些知名公共课补下所需的东西,或是去查相应的资料,里面会涉及到统计学原理,线性代数等,完全可以把R语言课程从头到尾学一遍,基本上就可以卷过很多同行了。学习过程就是坚持的过程,一定要坚持到R语言派上用场,且能够达到自己发SCI、工作晋升所需的地步,语言工具的重要性才能真正体现。反过来看,如果没有实际毕业、晋升的驱动,必须用到R语言助攻,纯粹靠自己去学习,很多人是无法坚持闯关到最后的。闯到最后一关的我,也收到了来自R语言的大力回馈,等你发完SCI,你就知道它有多香了!众所周知,R语言在数据分析界是当之无愧的“瑞士军刀”。内置了海量统计函数,你可以利用它,对数据进行快速的交互分析。通过R语言,你不仅能做出很多高质量的美腻又直观的数据图,还能巧借他人数据,“无中生有”的获得可用于发表SCI的研究数据。真可谓是,R语言在手,年输出SCI过3篇并不罕见。R语言对临床和科研兼顾的医学工作者来说,虽然是项必GET技能,但是,很多医生医学生苦于没时间,三天打鱼两天晒网,很难一口气学完R语言。为了让大家快速上手R语言,解螺旋现0元包邮送给大家一本《R语言医学数据分析实战》,让你通过这本书一口气学完R语言。
作为一本R语言百宝书,本书作者长期在医学院校讲授医学统计学,具有丰富的教学经验;在介绍统计方法时,不拘泥于繁琐的细节,而是让你看到问题的本质和整体结构,并很快获取重要信息。上下滑动查看
第1章~第3章介绍了R语言的基本用法
第4章介绍了数据可视化
第5章介绍了基本的统计分析方法
第6章~第8章介绍了医学研究中常用的三种回归模型
第9章介绍了生存分析的基本方法
第10章~第12章介绍了几种常用的多元统计分析方法
第13章介绍了临床诊断试验的统计评价指标和计算方法
第14章介绍了在医学科研实践中常用的Meta分析
医学人需要用到的R语言操作,全覆盖!你不仅能掌握使用R及相关包快速解决实际问题的方法,还能更深入地理解数据分析。
先别说现在学不学,先收藏起来吃灰,遇到不会的再回来翻也是不错的选择。心动理由二:大量实战案例讲解,对零基础医学小白超友好手把手带你掌握R及相关包使用方法,快速解决实际问题的方法,还能更深入地理解数据分析。以医学数据为例,讲解如何使用R进行数据分析,结合大量精选的实例对常用分析方法进行了深入浅出的介绍,以帮助你解决医学数据分析中的实际问题。让有研究基础的医学生和零基础小白都能够轻松玩转R语言。书中不仅配有大量的案例解析和程序示例,每一章都配有练习题,书末附有习题的参考答案。这样安排,既方便教学,也方便了零基础小白及时检验自己的学习成果。书中示例和习题解答的源程序可以从异步社区下载,同时配套提供彩图。函数名的索引附在书后以方便读者速查。
适合人群:
01临床医学、公共卫生其他医学相关专业的本科生和研究生
02零基础想要学习R语言的入门者
03写论文急需用R语言统计和作图的科研人员
我们很难从小白一下子变成R语言高手,但是,从这本书开始,你将迈开R语言的第一步。快带走你的逆袭宝典——《R语言医学数据分析实战》!