爆款 | Medium上6900个赞的AI学习路线图,让你快速上手机器学习
翻译 | AI科技大本营(rgznai100)
参与 | thinkdeeper
Part 1:为什么机器学习如此重要
AI科技大本营编者按:
这篇文章在Medium上总共获得了6900多个赞,在Medium上极受欢迎。受欢迎最大的原因是,作者能以比较浅显的文字,将机器学习所囊括的各类原理讲得清楚透彻。而这,对于以下三类人群来说,简直是个福利包:
想要快速提升机器学习能力的技术人员;
想要初步了解机器学习,并愿意接触相关概念的非技术人员;
任何对机器是如何思考感兴趣的人。
虽然文章中也会讨论概率、统计学、程序设计、线性代数和微积分的基本概念,但在作者的深入浅出的语言描述下,即便没有相关背景知识,也不会觉得难懂。
如果你想在3个小时内快速了解机器学习的概念,也不知道上哪里找价值高的指导性文章,建议您阅读该作者系列文章。AI科技大本营会陆续更新该系列的Part2、3、4、5部分及资源列表。
Part 1:为什么机器学习重要。人工智能与机器学习概述——过去,现在,将来。
https://medium.com/machine-learning-for-humans/why-machine-learning-matters-6164faf1df12
Part 2.1:监督学习。线性回归,损失函数,过拟合,梯度下降。
https://medium.com/machine-learning-for-humans/supervised-learning-740383a2feab
Part 2.2:监督学习II。两种分类方法:逻辑回归和SVMs。
https://medium.com/machine-learning-for-humans/supervised-learning-2-5c1c23f3560d
Part 2.3:监督学习III.。非参数学习:k最近邻,决策树,随机森林。并介绍交叉验证,如何调参和模型融合。
https://medium.com/machine-learning-for-humans/supervised-learning-3-b1551b9c4930
Part 3:无监督学习。聚类:k-means,层次聚类。降维:主成份分析法(PCA),奇异值分解(SVD)。
https://medium.com/machine-learning-for-humans/unsupervised-learning-f45587588294
Part 4:神经网络。深度学习的工作原理,以及卷积神经网络(CNN),循环神经网络(RNNs)和实际应用。
https://medium.com/machine-learning-for-humans/neural-networks-deep-learning-cdad8aeae49b
Part 5:增强学习。介绍马尔可夫决策过程。Q-learning,策略学习,深层增强学习。价值学习问题。
https://medium.com/machine-learning-for-humans/reinforcement-learning-6eacf258b265
附录:最好的机器学习资源机器学习课程资源列表。
https://medium.com/machine-learning-for-humans/how-to-learn-machine-learning-24d53bb64aa1
本篇为系列的第一篇文章,作者以讲故事的方式,告诉你,为什么机器学习如此重要。
这让人想起前不久小扎与马斯克关于“AI是否会超越人类”的论战,小扎说AI只是帮人提升效率,让人能够专注于更重要的工作;而马斯克则在twitter上公开批小扎“理解太浅薄,没有看到更长远的威胁”。
本篇文章的观点与马斯克如出一辙,作者对未来充满担忧,也正是这份担忧,他提出:
虽然预测未来有点不现实,但有一件事是肯定的:2017年是了解机器如何思考的最好开始时间。
在他看来,人们必须深入机器了解世界的内部细节,搞清楚机器到底要什么,它们的偏见和弱点是什么。
而要搞清楚这些问题,作者强调“得把机器当成人来研究”;正如研究心理学和神经科学,探索人类如何学习、决策、感觉等课题。从这个层面来说,这已经不单单是技术问题了,而是需要综合逻辑、心理、哲学、语言学等各学科,才能真正摸清楚黑匣子背后的秘密。
正文:
人工智能比本世纪的任何其他创新都来得更猛,而它也将更有力地塑造我们的未来。
在这个技术统治的世界里,任何不了解它的人,会很快发现自己落..伍...了...他会对即将到来的魔法世界,呈一脸懵逼状。
虽然人工智能历代的潮起潮落已经被各大资料文章说烂了,早已老生常谈,但请保持点耐心,我仍想用自己的方式,将其梳理一遍。
在经历了过去四十年的几番AI停滞和发展周期之后,数据的爆发和算力的提升让人工智能终于突破了瓶颈。
2015年,Google训练了一个对话机器人(AI),不仅可以作为技术支持与人进行交流,还可以跟人讨论道德问题,表达意见和回答一般性的基于事实的问题。
Vinyals&Le,2017
同年,DeepMind开发出一个程序,仅以像素和游戏得分作为输入,在49局 Atari游戏中超越人的表现。
不久后,DeepMind再次实现自我超越,发布一款名叫A3C的新的前沿游戏算法。
与此同时,AlphaGo击败了世界顶级围棋选手,这是继机器征服国际象棋后,历经二十年时间,再次在以人类为主导的游戏中大获全胜。
许多围棋大师不理解,为什么一台机器能掌握这个古老的中国战略游戏,机器怎么可能掌握其中的精髓和复杂,在10¹⁷⁰个可能的布局中大败人类。要知道,宇宙中原子的数量也就 10⁸⁰。这太不可思议了。
图为与AlphaGo进行了一场比赛失败后,职业围棋选手Lee Sedol在复盘这局棋局
不过,这还没完。
2017年3月,OpenAI用自己发明的语言开发机器人,有效地实现了自己的目标。不久之后,Facebook成功训练了会谈判甚至说谎的机器人。
2017年8月11日,在多人在线游戏Dota 2的1v1比赛中,OpenAI击败世界顶尖游戏选手人士,这又让好一波人受到了惊吓。
观看全程比赛,请移步YouTube,Dendi (human) vs. OpenAI (bot)
除了这些惊天大逆袭,人工智能也开始渗透到我们的日常生活。
比如下面两张图片,你只用将相机对准菜单,选中的图片就可以通过Google翻译APP自动翻译成英文。
如果下一次你入住某酒店,致电前台让送牙膏到房间。当你打开门,眼前是一个小的家政送货机器人,不必惊讶。
各细分领域也开始借助人工智能进行智能化升级。
如今在医疗领域,AI可用于为癌症患者设计循证治疗计划,用于实时分析医学检测结果,并用于药物发现。(小编注:可参考AI科技大本营此前编译的一篇文章《一文讲述人工智能在医疗行业的九个落脚点,让你更懂AI》)
(小编多一句嘴:作者会在本系列的5个章节中,深入探讨这些技术背后的核心机器学习概念,并教你利用工具构建类似应用程序。)
下面我给出一个知识树的图片,从中可以看出,机器学习主要包括监督学习,无监督学习和增强学习三个方面。
人工智能主要是研究能感知周围世界、制定计划、并做出决策以实现其目标的机器人。其所需要的基础包括数学、逻辑、哲学、概率、语言学、神经科学和决策理论。许多领域都属于AI,如计算机视觉,机器人,机器学习和自然语言处理。
机器学习则是人工智能的一个子领域。它的目标是让计算机自己学习。机器学习算法使其能够在数据中识别模式,从而构建模型,而不是利用预定义的规则进行预测。
智力大爆炸
其实,上述讨论的例子,尽管会让人一惊,但都属于弱人工智能(ANI),不过它确实能高效解决特定任务。
我们一直在为强人工智能(AGI)做一些基础性的推进工作。AGI的定义是一种能执行人类所要求的各类复杂任务,包括在不确定情况下进行学习、规划和决策,用跟人类一模一样的语言方式进行交流、讲笑话,指挥股票交易或自己编程。
会自己编程,这一点尤为关键。一旦我们创造了一个能自我改进的AI,它将会以一种循环递归的方式进行自我完善。这预示着,我们将在未来的某个时期,将进入到一个智能爆炸的时代,
超智能机器可以超越任何人的智力活动。由此可以推出,设计这台超智能机器是人类智力活动之一,超智能机器大于人类的智力活动,那超智能机器可以设计出更好的机器。
如此一来,将会产生智力爆炸,远远超过人类的智力大爆炸。
可以这么说:第一台超智能机器是人类最后的一个发明。
下图被称为奇点。该术语借用于发生在黑洞中心的引力奇点,一个无限拥有无限密度的一维点。在这里,我们惯常理解的物理定律已无法适用。
我们对黑洞里面到底是如何的一番景象完全搞不清楚,因为没有光线可以逃脱这个黑洞。
同样,在我们解锁AI的自我改进能力之后,我们也没有办法预测将会发生什么。
正如用于人类实验中的小白鼠,它永远也不知道人类在对自己做什么,它只能肤浅地理解为人类在帮他们获得更多的奶酪。
最近,人类未来研究所发表了一份调查报告,该报告调查了AI研究人员对实现AGI时代的预测。
研究人员认为在45年后,AI有50%的胜算超过人类。当然,有人说时间更长,有人说已经没几年了。
这是2005年在奇点临近一书中的图片。如今,2017了,墙上还能有多少我们自以为是的图片呢?
超人工智能的出现,对人类到底是件好事还是坏事?
先不做好坏的预测,而是谈一个很实际的问题:我们怎么能用一种对人类友好的方式,来指定AI做我们想让他做的事情呢?
要达到这个目的,我们就了解机器学习,不是应用机器学习,而是真正搞明白。
机器学习——避免机器逆袭的唯一通路
所以我一直笃定一件事:2017年,该是我们了解机器如何思考的开始时间了。
这可不是拍脑袋,借助哲学抽象概念或其他形象比喻来理解和学习AI。而是,我们必须深入其中,了解机器世界的内部细节—它们到底“想要什么“,它们潜在的偏见和弱点到底有哪些——正如我们研究心理学和神经科学,以了解人类如何学习、决策、行为和感知这样。
有关AI的复杂性和高风险的问题,将在未来几年内越来越多引发人们的注意。不少问题亟待解决:
我们如何应对AI 在现有数据集中显而易见的系统性偏见倾向?
世界上最强大的技术人员关于人工智能潜在风险和利益的根本分歧应该如何看待?
在一个没有工作的世界中,人类的使命感如何?
机器学习是通用人工智能的核心,同时也将改变每一个行业,并对我们的日常生活产生巨大的影响。这就是为什么我们认为了解机器学习是值得的。至少在概念层面上,我写这些系列文章比较适合入门,不会有一种一来就将人拒之千里之外的感觉。
那么讲了这么多,到底如何阅读这个系列文章呢?
你不一定要把整个系列全部读完,这里我有三个建议,具体还得取决于你的兴趣和时间。
1. T型方法。从头到尾阅读。并在每一节做总结。这种方式会让你能更积极主动地阅读,并且不容易遗忘。为了深入了解你最感兴趣的内容,我们将会在每个部分的末尾提供一些参考资料供你拓展。
参考: Feynman technique
地址:https://mattyford.com/blog/2014/1/23/the-feynman-technique-model
2. 专注方法。直接阅读你最感兴趣的部分。
3. 80/20 法则。大概浏览全部内容, 对主要概念做笔记即可,并理解它。
对于80/20法则,可参考:
https://www.thebalance.com/pareto-s-principle-the-80-20-rule-2275148
好的,今天我们的开篇就到此,请关注AI科技大本营微信,获取持续更新。
关于本系列文章作者的简介:
Vishal最近在Upstart任职,这是一个利用机器学习来定价信贷,借贷过程自动化和获取用户的贷款平台。他的研究主要基于如何思考创业,应用认知科学,道德哲学和人工智能的伦理学。
Samer是UCSD的计算机科学与工程硕士生,Conigo Labs的联合创始人。在毕业之前,他创立了TableScribe,这是中小型企业的商业智能工具。他花了两年的时间为麦肯锡的财富100强企业提供咨询服务。Samer曾经在耶鲁大学学习计算机科学与伦理学,政治学和经济学。
两人的目标是,巩固自己对人工智能,机器学习的理解,以及深入了解它们之间的融合方式 ,并希望在此过程中创造值得分享的东西。
原文地址
https://medium.com/machine-learning-for-humans/why-machine-learning-matters-6164faf1df12
AI科技大本营
招实习生啦
这次我们有以下几个方向:
微信运营、科技音视频运营和技术编辑各一名。
有意向的小伙伴,请在AI科技大本营微信公众号回复“实习生”,查看详细工作要求和职位描述,以及简历投递渠道。