JHU《Data Science(数据科学)》学习笔记—序言
The following article is from 珠江肿瘤 Author 李雪纯 冯文清
本次数据科学系列课程将主要学习以下8个章节的内容,推文目录如下。
一、数据科学家的工具箱
➢1. 数学科学家的工具箱
本章节共1期,主要介绍数据科学家常用的一些数据分析相关的软件工具,包括命令行界面、 Git 、GitHub、 RStudio等。
二、R语言程序设计
本章节共5期,介绍了如何用R编程以及简要介绍如何使用R进行有效的数据分析。
三、获取和整理数据
本章节通过4期内容,主要介绍收集,整理和共享数据所需的基本知识,包括如何从网络,API,数据库以及周围的同事那里获取各种格式的数据,如何将数据变得更整洁方便分析处理,极大地加快了下游数据分析任务的速度。
四、探索性数据分析
本章节共5期,主要介绍汇总数据的基本探索技术,我们将详细介绍R中的绘图系统将数据进行可视化,并利用可视化图表进行数据分析。
五、统计推断
统计推断是从样本数据得出有关总体的结论的过程,本章节将通过8期内容利用R的可视化功能以一种更易理解的方式介绍统计推理的基础知识,以及统计推理在R中的运用。
六、回归模型
本章节共6期,主要介绍使用回归模型进行统计推理的相关知识,包括线性回归、多元回归、广义线性回归模型以及模型的建立、评价和选择过程中的基本概念和实际运用。
七、实用机器学习
数据科学家和数据分析师执行的最常见任务之一是机器学习和预测。本章节通过8期内容主要介绍机器学习的基础概念和步骤,一系列基于模型和算法的机器学习方法,包括回归,分类树,朴素贝叶斯和随机森林等,并利用这些模型和算法对数据进行预测并评估。
八、数据产品开发
本章节主要介绍如何在R中使用统计数据和统计产品开发工具进行数据产品的开发,比如为数据产品创建简单的Shiny 交互式Web应用程序、创建交互式图表、创建R包或创建swirl课程,并将这些数据产品上传分享。
大家是不是开始期待并且想要了解以上这些强大的数据分析功能具体是怎样实现的呢?OK,话不多说,和我们一起在接下来的正式推送中学习数据科学,掌握数据分析技能吧!