干货|李宏毅ML课程[1]Learning Map
李宏毅ML课程[1]Learning Map
下面ppt均来自李宏毅老师上课讲义~主要是记录自己在学习李老师课程的一些自己的笔记~
首先介绍一下本文要学习的东西~如下图。
根据上图,包括监督学习,非监督学习,半监督学习,迁移学习,增强学习等内容,每一个模块中又有不同内容。
比如其中监督学习不包括线性模型,非线性模型等等
回归模型的特性,是目标函数的输出是一个标量。
比如:输入是今天上午的PM2.5,以及昨天的PM2.5,要求输出明天上午的PM值(一个标量)
如下图表示:
其中包括二分类问题,如下:
也包括多分类问题:
其中二分类典型的应用是,刷选垃圾邮件。如下:
其中多分类问题的一个应用是判断文档的主题,如下:
来了一篇文章,我们判断是政治类,经济类或者是体育类,还是其它类别~
当然这些问题也可以用深度学习来解决。
其中,我们用CNN来作为学习分类器,判断最终的所属类别。
下面1简单介绍一下几种不同类别的学习。
通过一部分狗猫的训练数据,加上一些不相关的标注或者未标注的数据进行训练,得到一个模型。
(1)一段声音,我们需要得到最可能的一句话。这个时候,我们无法穷举所有的句子,然后挑选概率最大的句子。因为句子个数是无穷多的
(2)机器翻译例子中,有一个源语言,要得到一个目标语言,也是无法之间使用多分类模型的,因为句子的个数是无穷的。
(3)第三个例子,人脸识别,判断某个区域是否为人脸,也是无法之间用多分类模型进行预测,因为区域的个数也是无穷多个的。
其中监督学习与强化学习的区别是:
在监督学习下:
在当前某个状态下,期望下一步动作,就是5-5
或者在当前某个状态下,期待下一步动作,就是3-3
也就是说,监督学习训练数据中,有着完整的输入,输出。
而强化学习是通过不停的比赛,强调如何基于环境而行动,以取得最大化的预期利益。中间过程有可能某个下子状态是不利的,但是对于整体没有关系。
参考自李宏毅老师上课讲义
推荐阅读文章:
全是通俗易懂的硬货!只需置顶~欢迎关注交流~