知乎热议:如何学习机器学习
👇 连享会 · 推文导航 | www.lianxh.cn
🍎 Stata:Stata基础 | Stata绘图 | Stata程序 | Stata新命令 📘 论文:数据处理 | 结果输出 | 论文写作 | 数据分享 💹 计量:回归分析 | 交乘项-调节 | IV-GMM | 时间序列 | 面板数据 | 空间计量 | Probit-Logit | 分位数回归 ⛳ 专题:SFA-DEA | 生存分析 | 爬虫 | 机器学习 | 文本分析 🔃 因果:DID | RDD | 因果推断 | 合成控制法 | PSM-Matching 🔨 工具:工具软件 | Markdown | Python-R-Stata 🎧 课程:公开课-直播 | 计量专题 | 关于连享会
连享会 · 2022暑期班
作者:仵荣鑫 (厦门大学)
邮箱:rxwu_cn@163.com
温馨提示: 文中链接在微信中无法生效。请点击底部「阅读原文」。或直接长按/扫描如下二维码,直达原文:
编者按:机器学习作为人工智能的重要分支,受到人们的广泛关注。机器学习是一门多领域交叉学科,掌握机器学习技术是一项重要且充满挑战的任务。为此,编者梳理了知乎答主们对机器学习的建议。
目录
1. 技能准备
2. 入门学习
3. 进阶提升
4. 深度学习
5. 学习建议
6. 相关推文
1. 技能准备
刚开始接触机器学习,需要做一些必要的技能储备,过三关:英语、编程与数学。首先,英语需要具备阅读与听力能力。当前主流的书籍、期刊等资料大多是英文为主,我们无法避免地要看很多英文资料。
其次,关于编程语言,首推 Python,因为其良好的拓展支持性,主流的工具包都有 Python 版本。在特定情况下,选择 R 作为编程语言也是可以的。编程语言学习推荐:
Programming for Everybody: Python Learn R with R tutorials and coding challenges: R
最后,数学包括微积分、线性代数与统计学,可通过教育性非营利组织「可汗学院」学习。数学建议先搞定线性代数,推荐以下课程:
斯特朗教授的课程由浅入深,环环相扣:完整版-麻省理工-线性代数-全34讲+配套教材 配合斯特朗教授的其他课程学习,效果事半功倍:MIT《数据分析、信号处理和机器学习中的矩阵方法》课程
统计学习是机器学习的基石,推荐以下课程:
Stanford : Statistical Learning 斯坦福大学:统计学习
2. 入门学习
刚迈入机器学习的大门,需要有适合的学习途径:视频、书籍与动手。机器学习视频入门首选:
Machine Learning by Andrew Ng
吴恩达老师的这门课可以加快学习进度,但不要跳过练习题,练习题非常有价值,虽然并非用 Python 写的 (而是 Matlab/Octave)。如果你不想学 Matlab,那么最好找点别的用 Python 习题练练手。当然,以下课程也非常不错:
李宏毅 2021/2022春-机器学习课程
在学习视频时,推荐阅读两本非常好的入门书籍:
Python 机器学习 (作者 Sebastian Raschka):阅读本书可以快速对如何使用 Python 机器学习框架 Sklearn 有一个基本的了解,可以很快上手开始工作; An Introduction to Statistical Learning with R (ISL):ISL 是 The Element of Statistical Learning (ESL) 的入门版,不仅大量去除了繁复的数学推导,还加入了 R 编程的部分,方便大家可以尽快上手。
入门书籍推荐还强推:
周志华老师的《机器学习》:人称西瓜书,是经典入门教材之一,是一本大而全的书!内容中有用到西瓜举例子。建议和《南瓜书》一起看; 李航老师的《统计学习方法》:这本书对机器学习原理的解释、公式的推导非常详尽,相信看完这本书,不会再说机器学习是玄学了。建议配合「白板推导系列」学习。
学习理论后,做一些基于 Python 的动手练习:
Python 教程-廖雪峰的官方网站:教程质量很好,没有必要全看完,大概了解 Python 的基础语法即可,这步是为下面的练习做准备; 《机器学习实战》(作者 Peter Harrington):这本书基于 Python 对一些主要的机器学习算法进行了代码实现。一定要照着敲一遍。
3. 进阶提升
实战热身:
《利用 Python 进行数据分析》(作者 Wes McKinney): numpy
与pandas
是 Python 进行处理数据的两个关键库,这本书讲解了这两个库的使用方法;scikit-learn: machine learning in Python 是 Python 上最流行的机器学习/数据科学工具包。比较推荐的方法是把主流机器学习模型 Sklearn 中的例子都看一遍。Sklearn 的文档不仅提供了练习数据、sklearn 的相关代码实例,还提供了可视化图; 机器学习实战:基于 Scikit-Learn 和 TensorFlow:为数不多的把理论和实践相结合的比较棒的书,尤其是代码部分!
实战平台:
kaggle:Your Home for Data Science; 推荐一篇不错的文章:Kaggle 入门,看这一篇就够了; 如果是新手,建议把 Titanic 项目玩一次:Titanic-Machine Learning from Disaster; 阿里云天池:天池大数据众智平台-数据科学家社区。
4. 深度学习
深度学习推荐以下视频课程:
李宏毅:深度学习 (2017) 吴恩达:深度学习课程,网易云课堂上线了这门课的中文版。
深度学习的几个大应用,自然语言处理、自然语言理解、深度视觉算法:
自然语言处理:2019 最新斯坦福大学 CS224n 深度学习自然语言处理课程 斯坦福大学 CS224U:自然语言理解 2019 最新课程 斯坦福 CS231n 《深度视觉识别》课程 (2017) 中科院宗成庆:自然语言处理公开课 (64 集)
深度学习的书籍推荐两本,一本理论性强的,一本实践性强的:
Deep Learning:由 Ian Goodfellow、Yoshua Bengio 和 Aaron Courville 三位大牛合著的非常权威的一本书,也是后来出版的深度学习书籍的参考; 《动手学深度学习》:深度学习的交互式学习体验。书中不仅阐述深度学习的算法原理,还演示它们的实现和运行。
更多深度学习的干货:
机器学习 (Machine Learning) 与深度学习 (Deep Learning) 资料汇总
5. 学习建议
自学机器学习的误区和陷阱:
不要试图掌握所有的相关数学知识再开始学习机器; 不要把深度学习作为入门第一课; 不要收集过多的资料,要分辨资料的时效性。
将技能落在实处,防止练就一身屠龙之技。机器学习最大的幻觉就是觉得自己什么都懂了,但等到真的使用时发现并不奏效。如果此刻燃起了学习机器学习的热情,就请赶快行动!
6. 相关推文
Note:产生如下推文列表的 Stata 命令为:
lianxh 机器学习, m
安装最新版lianxh
命令:
ssc install lianxh, replace
专题:论文写作 Semantic scholar:一款基于机器学习的学术搜索引擎 专题:Stata教程 Stata-Python交互-7:在Stata中实现机器学习-支持向量机 专题:Python-R-Matlab MLRtime:如何在 Stata 调用 R 的机器学习包? 专题:其它 知乎热议:机器学习在经济学的应用前景 专题:机器学习 机器学习在经济学领域的应用前景 机器学习如何用?金融+能源经济学文献综述 知乎热议:纠结-计量经济、时间序列和机器学习 机器学习:随机森林算法的Stata实现 Stata:机器学习分类器大全
课程推荐:因果推断实用计量方法
主讲老师:丘嘉平教授
🍓 课程主页:https://gitee.com/lianxh/YGqjp
New! Stata 搜索神器:
lianxh
和songbl
GIF 动图介绍
搜: 推文、数据分享、期刊论文、重现代码 ……
👉 安装:
. ssc install lianxh
. ssc install songbl
👉 使用:
. lianxh DID 倍分法
. songbl all
🍏 关于我们
连享会 ( www.lianxh.cn,推文列表) 由中山大学连玉君老师团队创办,定期分享实证分析经验。 直通车: 👉【百度一下: 连享会】即可直达连享会主页。亦可进一步添加 「知乎」,「b 站」,「面板数据」,「公开课」 等关键词细化搜索。