查看原文
其他

干货|李宏毅ML课程[1]Learning Map

2017-06-23 忆臻 机器学习算法与自然语言处理

李宏毅ML课程[1]Learning Map

下面ppt均来自李宏毅老师上课讲义~主要是记录自己在学习李老师课程的一些自己的笔记~

首先介绍一下本文要学习的东西~如下图。

根据上图,包括监督学习,非监督学习,半监督学习,迁移学习,增强学习等内容,每一个模块中又有不同内容。


比如其中监督学习不包括线性模型,非线性模型等等


Regression



回归模型的特性,是目标函数的输出是一个标量

比如:输入是今天上午的PM2.5,以及昨天的PM2.5,要求输出明天上午的PM值(一个标量

如下图表示:

那么训练数据表示格式如下:

然后通过训练算法,学习得到一个模型。


Classification



其中包括二分类问题,如下:

 也包括多分类问题:



其中二分类典型的应用是,刷选垃圾邮件。如下:

每来一个邮件,进行判断是否是垃圾邮件(二分类问题)

其中多分类问题的一个应用是判断文档的主题,如下:

来了一篇文章,我们判断是政治类,经济类或者是体育类,还是其它类别~


Deep Learning



当然这些问题也可以用深度学习来解决。

其中,我们用CNN来作为学习分类器,判断最终的所属类别。

下面1简单介绍一下几种不同类别的学习。


Semi-supervised Learning



半监督学习是通过一部分标记数据以及一部分未标注数据学习得到一个模型。


Transfer Learning



想要训练出一个模型,判断图片动物的种类是狗还是猫。

通过一部分狗猫的训练数据,加上一些不相关的标注或者未标注的数据进行训练,得到一个模型。


Unsupervised Learning



通过全是未标注的数据学习到一个模型。


Structured Learning



结构化学习并不能简单的看做是一个多分类问题,比如:

(1)一段声音,我们需要得到最可能的一句话。这个时候,我们无法穷举所有的句子,然后挑选概率最大的句子。因为句子个数是无穷多的

(2)机器翻译例子中,有一个源语言,要得到一个目标语言,也是无法之间使用多分类模型的,因为句子的个数是无穷的。

(3)第三个例子,人脸识别,判断某个区域是否为人脸,也是无法之间用多分类模型进行预测,因为区域的个数也是无穷多个的。


Reinforcement Learning



其中监督学习与强化学习的区别是:

在监督学习下:

在当前某个状态下,期望下一步动作,就是5-5

或者在当前某个状态下,期待下一步动作,就是3-3

也就是说,监督学习训练数据中,有着完整的输入,输出。

强化学习是通过不停的比赛,强调如何基于环境而行动,以取得最大化的预期利益。中间过程有可能某个下子状态是不利的,但是对于整体没有关系。

参考自李宏毅老师上课讲义


推荐阅读文章:

深度学习的梯度消失问题

深入浅出理解决策树算法(一)-核心思想

浅析神经网络中一点优化知识



全是通俗易懂的硬货!只需置顶~欢迎关注交流~




您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存