第二届R语言数据分析与可视化培训班
北京赛博尔医药科技有限公司(www.cibrmed.com)将于2019年 6月14日 至 2019年 6月16日(周五至周日)举办第二届R语言数据分析与可视化培训班(课程内容详见课表安排)。欢迎大家前来咨询及报名参加。
此次培训班依然坚持小班教学,手把手带教的教学模式,此次培训限定人数30人左右,报名敬请从速,争取使每一位参加培训的学员能够在数据分析方法上取得进步。
一
培训简介
R语言带来了数据分析领域新的革命!因其具有强大高效的数据分析能力和自由美观的可视化绘图效果,在数理统计、互联网、人工智能、金融、生物医学、天文地理、物理化学等各个领域脱颖而出,尤其在国际上广泛受到研究生、一线科技人员、临床医生和学者的青睐。R语言因其简洁易懂、免费开源,本着资源共享和共同提高的原则,截至2018年12月其在线资源库已有远超10000个免费开源的R工具包以及无数的在线资源和使用人员。
掌握R语言不仅可以提高复杂数据分析效率、绘制各类漂亮图表,促进发表高质量国际学术论文,而且还可以在他人工具和源码基础上修改完善,设计并发布自己的数据分析工具,提高自己在相关领域的国内外知名度。因此,及时掌握R语言,不仅是一项基本功,更是站在巨人肩膀上实现科研创新的得力助手。
本培训班将通过为期三天但内容丰富的讲解和训练,使学员快速入门R语言,并提高至能够自主开展数据处理、分析和可视化的能力,为后期使用R语言开展模型研究、工具设计等高级应用奠定坚实基础。
图 1 基于R语言的生物医学数据可视化示意图
二
培训对象和目的
本次培训班面向的对象是各单位从事数据处理、时序分析、图像图形处理分析、可视化交互处理分析等领域相关的企事业单位技术骨干、科研院所研究人员和在校研究生等相关人员,以及数据分析和可视化的广大爱好者。
NO.1
培训班为以下人员量身定制:
●R语言零基础或入门级,但渴望能够快速get新技能的青年人员;
● 期望开展创新性、创造性工作的,从事科研和临床研究的医生、研究生、青年科技骨干等;
●从事模型研究的数据分析人员,从事诊断分析的图形图像可视化分析人员;
●对重复性实验、成果绘图等要求较高的、有国际学术论文发表需求的人员,等。
NO.2
培训班的目的是使学员能够:
●熟悉R和Rstudio软件以及R 包的使用技巧;
●掌握R语言的数据类型、对象操作和编程技巧;
●掌握R语言基本的数据处理、建模分析和图形图像可视化方法和绘图技巧;
●通过若干实例,了解fMRI、DTI、EEG等的R语言处理、分析及可视化的方法,了解相关R packages。
三
设计自己心中的分析工具or依赖已集成好的工具/GUI?
对于从事数据分析和可视化的研究人员来讲,最至关重要的莫过于能够“亲近”自己的数据、分析其特定规律并完美展示其各项特性。虽然在前期部分科研人员的努力下已经设计开发完成了一些高度集成好的数据分析工具(图形用户界面GUI),对于数据分析新手来讲可按照流程通过一步步点击鼠标即可完成数据的导入、处理、分析、可视化和导出等,操作简便,然而,开展数据分析的科研人员必须要设计自己的数据分析流程、方法、模型、可视化效果、结果形式等,对于这些创新性研究则已高度集成的GUI能力受限。因此,利用R开放共享的工具包和软件代码,使用者可以Inspect your data and check your model at every step,设计和开发满足自己需求的工具包或者程序,开展创新性的数据分析研究工作。
四
为什么要掌握新技能R语言
"The nice thing about standards is that you have so many to choose from." — Andrew S. Tanenbaum.
现在已经有可以使用的数据处理、分析和可视化的相关工具和编程语言,为什么还要学习一门新的数据分析语言R?
no.1
R语言软件、包、程序和文档等全部free、open source很重要的一方面,R是免费的,R相关软件和工具等可以从官方网站任意地下载安装和免费使用,新版本还能免费自动更新,各种程序代码和文档也都可以随意免费下载和使用,代码和文档有新修订时也可免费自动更新。更重要的一方面,R是开源的,所有数据处理、分析和可视化的工具以及程序,源代码都是公开的,所以用户可以在别人基础上修改代码、添加功能、完善工具等。并且,用户还可以设计开发自己的工具包。
no.2
R语言强大的数据分析能力和团队支撑统计科学家发明了R语言,并且R语言软件设计开发的核心成员也主要是统计学家。除了统计学科的人员使用R语言外,很多涉及数据分析(如金融、工程、生物、医学等)领域的工程和科研人员也都广泛使用R语言开展研究工作。截至2018年12月,R官方网站CRAN知识库里,已经远超过10000个R工具包(Packages),由各行各业的科研人员在不断地进行补充、维护和更新。对于每个领域甚至每个R工具包,都有相应地博客、论坛、开发人员等提供及时和专业的解答,促进大家共同维护和完善相关的代码和工具包。
no.3
R包的使用和管理so easyR对于工具包的管理非常完善,一方面,R工具包的存储和管理全部在云端,用户不必在互联网苦苦搜寻想要的工具包,在R软件中即可一键检索、下载和更新,还会有相关推荐。另一方面,下载和安装用户感兴趣地R工具包时,该工具包依赖的其它所有工具包(包括代码和文档)都会自动地下载和安装,直至该用户感兴趣地工具包可直接使用,而无需用户费尽周折不断去下载和安装相关工具。
no.4
R语言可直接生成报告文档使用R自带的工具包(如Knitr)可以按照默认或指定格式(如LATEX)编写数据分析报告、使用说明文档、学术论文、学位论文等。支持边数据分析、边一键生成相关报告,报告可囊括文本说明、程序代码和相应结果、数据内容、公式图形图表、数据分析结果、甚至交互式动态分析等,报告文档布局精致、格式统一、数据详细、图表精美,是编写实验报告、学术论文等的得力助手。
no.5
R语言方便开展重复性实验、创新性尝试随着科学研究的国际化和开放共享,科研成果的发表除了公开研究方法外,还伴随着原始数据、方法参量参数、程序代码、中间数据和结果数据的公开,以便于学术界通过重复性实验得以验证。当前越来越多的科研人员通过R语言进行数据处理、分析和结果可视化,不断地公开着相关地研究数据、R工具包、R程序代码和使用手册。使用者可直接利用相关文档和数据,基于前沿研究公开的R工具包和程序代码,开展重复性实验,同时通过修改和完善相应程序代码进行创新性研究尝试,形成并发表自己更前沿的研究成果。
五
一些R语言数据分析和可视化示意图
图 2 基于R语言的fMRI脑网络分析示意图
图 3 基于R语言的顶点组分析广义线性模型GLM分析示意图
图 4 基于R语言的多阈值置换矫正MTPC分析示意图
图 5 基于R语言的Bootstrap 分析和多变量分布分析示意图
图 6 基于R语言的组分析箱线图和直方图示意图
图 7 区域贡献和个体贡献(留一法)分析示意图
图 8 基于R语言的脑图邻接矩阵组分析示意图
图 9 基于R语言的密度测度多元分析示意图
图 10 基于R语言的皮质厚度组分析示意图
图 11 利用R语言自主设计开发脑图网络分析工具示意图
六
课程安排
时间 | 课程安排 | 主要内容 | |
第一天 | 上午 | R语言 使用技巧和基础知识 | ● R的过去现在与未来,R语言及RStudio的配置和便捷使用技巧; |
● 如何站在巨人肩膀上高效利用R在线知识库(综合档案网络CRAN、R包、Github等); | |||
● R语言基础知识(对象、函数、程序等); | |||
● R初中级数据结构(字符串、向量、数组、矩阵等); | |||
下午 | R语言 数据处理基础 | ● R高级数据结构(时间序列、列表、数据框等); | |
● R语言数据读写操作,R基本数学运算; | |||
● R数据对象的运算(向量、时间序列、矩阵、数据框等); | |||
● 数据对象的处理(数据整理、字符串操作、缺失值、数据抽取与追加、多维变换等); | |||
晚上 | 数据操作与处理编程实践 | ● 熟练利用RStudio进行数据基本操作和处理,熟悉相关R语言函数; | |
第二天 | 上午 | R语言 数据分析基础 | ● 数据分析基础(概率分布检验、方差分析、回归分析等); |
● 统计模型基础(广义线性模型、多项式模型、非线性模型等); | |||
● 时间序列分析基础(序列分解、自相关分析、时间序列模型等); | |||
● 聚类分析、因子分析、主成分分析、异常分析基础; | |||
下午 | R语言 可视化基础和绘图技巧 | ● 数据的7种图表可视化(散点图、直方图、柱状/条形图、箱线图、面积图、热力图、相关图),自定义绘图函数; | |
● 序列、图形和图像的可视化及绘图技巧; | |||
● 绘图元素的添加和布局,子图绘制及画板布局技巧; | |||
● 高级绘图R包ggplot2简介; | |||
晚上 | 数据分析与可视化编程实践 | ● 熟练利用RStudio进行基础的数据分析和图表/图形/图像的可视化绘制,熟悉相关R语言函数; | |
第三天 | 上午 | R语言 数据处理、分析与可视化的若干实例 | ● fMRI数据处理、分析与可视化实例(如聚类、脑网络分析); |
● DTI数据的处理、分析与可视化实例(如纤维示踪成像); | |||
● EEG数据处理、分析与可视化实例(如滤波/平滑、时频分析、独立成分、事件相关电位); | |||
● PET数据处理、分析与可视化实例(如模拟和重建、神经受体占位); | |||
下午 | R语言 程序设计基础 | ● R语言编程快速上手和高效运算技巧(向量运算,行/列运算,批处理等); | |
● 自定义函数(传参和对象返回,局部/全局变量等),自定义程序,函数/程序的引用和调用; | |||
答疑和指导 | ● 课程相关内容的答疑,R语言编程实践的指导; | ||
● 课程外学员感兴趣方法、模型和绘图技巧的指导,自带数据的实验指导。 |
七
学员携带电脑要求
请各位培训学员自带笔记本电脑,学员自己有数据的可以带1-3例进行现场处理。
● 硬件需求:硬盘30GB以上可用存储空间,内存4GB及以上,CPU i5及以上,无线网卡,集成/独立显卡;
●系统需求:Window/MAC/Linux均可,Windows Vista/7/8/10 32/64位系统,或MAC OS X及以上系统,或Linux debian/redhat/suse/ubuntu系统;
●软件需求:学员可提前至R官方网站(https://mirrors.tuna.tsinghua.edu.cn/CRAN/)下载相应操作系统的R语言软件,然后至R-Studio官方网站(https://www.rstudio.com/products/rstudio/download/)下载相应版本的R集成开发环境软件RStudio。
八
培训老师简介
周博士,中国科学院大学信号与信息处理专业,数字图像处理方向,副研究员、硕士生导师;长期从事时间序列分析、数字图像处理、异常检测分析等方面的工程和科学研究工作,主持/负责国家自然科学基金、国家863课题、国防科技创新、国际合作重点项目等国家级项目近10项;具有丰富的R语言数据处理、分析和可视化等算法和程序设计经验,在领域知名IEEE期刊和会议上以第一作者发表论文十余篇,授权发明专利5项,领域多个国际期刊的审稿人、国际工作组成员。
九
其他
培训地点及费用
北京市经济技术开发区科创十三街18号院锋创科技园5号楼,具体见会议指南。所有参会人员2600/人(含资料费、培训费和午餐费,交通及住宿费自理)。
报名及缴费方式
请将报名回执发送至:Cibr_medical@163.com
杨老师13381109780
姜老师 15904965265
银行转账或者支付宝(账号:13381109780 户名:杨南),不接受现场缴费,谢绝录像,主办方提供发票。
单位名称(发票抬头,纳税人识别号) | |||||
姓名 | 性别 | 微信 | |||
电话号码 | 科室/专业 | ||||
缴费方式 | □转帐 □支付宝 (请选择在□打√) | ||||
银行信息 | 户名:北京赛博尔医药科技有限公司 账号:0200048409200117652 开户银行:中国工商银行股份有限公司大郊亭支行 | ||||
汇款备注 | 第二届R语言培训班 |
十
在线支持服务
参加培训学员将得到授课老师及公司技术人员的长期在线技术支持服务,伴随参加培训班的学员共同成长。
word版本报名回执单下载:
链接: https://pan.baidu.com/s/1Hq7sIueVJ4yFcxWJ30-f2Q
提取码: u42u
复制这段内容后打开百度网盘手机App,操作更方便哦
第一期R语言培训班总结与感言
为满足广大一线科研人员对R语言数据分析与可视化的刚需,去年起我们积极筹备了“R语言-从入门到提高”培训班。刚刚圆满结束的首届培训班,就吸引了来自天南海北的知名医院、研究所和高校的近20名学员前来集中参加培训。首期学员主要来自神经内科、神经外科、心理学、康复...等科室,不仅有刚刚踏入科研领域的硕士研究生、正在努力拓展研究领域的博士研究生,而且还集聚了多位富有一线科研经历和一线临床经验的教授、主任医师和主治医师等中青年骨干前来短暂闭关修炼。
为期3天的第一期R语言培训班,课程内容丰富、结构紧凑,学员提问积极、气氛活跃。大家学习和练习非常投入,即便课间休息时间,也纷纷边享用茶歇边继续操练(何不赶紧趁机放松一下),甚至出现了课堂练习没做完美味午餐都不吃的干劲(应该吃饱喝足了赶紧午休)。学员们晚饭后放弃休闲,(一起散步聊天后)继续在教室集中练习、或者在家在线讨论,将白天残留的疑惑逐个予以解决,并利用自带数据资料,第一时间学以致用。
短短几天下来,学员之间不仅能够相互讨论R语言学习心得、互相交流R数据数理和可视化技巧,而且还能相互探讨业务知识和学术问题,在快速掌握R语言基础的同时,还(通过吐槽)广泛结识了国内各地同行朋友,为今后的科研工作带来更多便捷。培训结束时,学员们纷纷表示意犹未尽,期望不久后能继续开设R语言高级培训班进行各类专题培训。大家在合影和互相扫码后,依依不舍地进行了道别,并满怀憧憬地期待着后期培训班再次会战或者今后科研上的合作。
培训结束后,我们还专门建立了R语言学习交流微信群,时刻在线答疑、共享最新资料、分享各自成果,确保即便没有了现场课堂,也能保证大家继续满腔热血地操练提高。
我们期待着新学员、新朋友的不断加入,共同提高我们的数据分析和作图技能!春播一粒粟,秋收万颗种,期待大家不久后高水平学术成果的不断涌现!
培训信息
科研服务
灌注数据处理服务
EEG/ERP数据处理服务
脑电数据预处理:使用EEGLAB对Neuroscan、Brain Products、EGI、ANT、Biosemi等主流脑电设备采集的脑电数据进行预处理。
ERP成分统计分析:提取ERP成分的波幅和潜伏期,并进行统计分析。
EEG频谱分析:使用傅里叶变换的方法计算脑电各个频段的功率,并进行统计分析;使用短时傅里叶变换、小波变换和希尔伯特变换的方法进行脑电时频分析(如ERD/ERS分析、试次间相位同步分析)。
基于sLORETA的脑电源分析:ERP成分源定位;特定频段EEG源定位;源空间的脑功能连通性分析。
功能连通性分析:使用相关、相干、相位锁定值和格兰杰因果分析研究电极之间功能连通性。
近红外数据处理服务
PET数据处理服务
功能磁共振数据处理
任务态激活脑区分析
任务态E-prime实验实
功能连接分析
局部一致性(ReHo)分析
低频振幅(ALFF/fALFF)分析
基于图论及ICA的脑网络分析
结构磁共振数据处理
基于VBM的灰白质分析
基于Freesurfer的皮层厚度分析
基于FSL的纤维束追踪
详情联系:13381109780(杨老师)