反向传播的意义及c++实现

2017-02-03 全球人工智能

本轮的主要内容是教会初学者如何用 c++来实现深度学习中至关重要的一个环节----反向传播算法的实现(部分内容参考： http://ufldl.stanford.edu/wiki/index.php/Backpropagation_Algorithm)。

主要内容：

介绍反向传播算法的作用

反向传播算法实现步骤

c++实现的一个例子

反向传播算法的作用

假设我们有一个固定的训练集，包含 m 个训练样本。我们可以使用批量梯度下降法来训练我们的网络。对于单个样本，我们可以将其训练误差定义为：

对于整个训练集，其误差为：

这里，后面一项是正则化项，权重衰减项。

首先需要明确的是：我们的目的是最小化误差函数J（W.b）。J是w,b的函数。训练一个伸进网络，我们会选择某种方法(可以参考《如何优雅地训练神经网络》)来初始化我们的权重。

根据梯度下降法的思想，沿着梯度的反方向是误差函数下降最快的方向。因此，可以得出更新系数的公式：

这里，是学习速率，可以理解为一个常数先不作讨论，特别地我们会发现 J（w.b）关于 w,b 的导数显得格外的重要。因为只要有了这两个导数，系数更新就易如反掌了。那么这个导数如何求呢？反向传播算法就是来解决这个问题的。

反向传播算法的主要步骤

反向传播算法的主要步骤如下：

1、进行一次前向传播(feedforward pass)，计算出各层的输出激活值

2 、对于网络的输出层的每个神经元，计算：

3 、对于层：

注意下标的顺序(可以结合“反向”二字理解下标)

4、计算偏导数

以上便是反向传播算法的主要步骤。

C++实现的一个例子见：https://github.com/xupeng082008/DeepLearning-Backpropagation

❈

全球人工智能近期经典文章推荐

❈

匹兹堡赌场的赌神——扑克牌机器人背后的理论