CV-Back Propagation

Computing Gradients

J (θ) = \sum_{i = 1} L (f_{L} (\dots f_{2} (f_{1} (x_{0}^{(i)}, θ_{1}), θ_{2}), \dots θ_{L}), y^{(i)})

Computing Gradients

θ_{L} \leftarrow \frac{\partial J}{\partial θ_{L}} = \frac{\partial J}{\partial X_{L}} \frac{\partial X_{L}}{\partial θ_{L}}

θ_{L - 1} \leftarrow \frac{\partial J}{\partial θ_{L - 1}} = \frac{\partial J}{\partial X_{L}} \frac{\partial X_{L}}{\partial X_{L - 1}} \frac{\partial X_{L - 1}}{\partial θ_{L - 1}}

nagJmK

要更新神经网络中某一层的梯度，我们需要基于反向传播（Backpropagation）算法的步骤。这是深度学习中训练神经网络的核心步骤，它可以分为几个主要步骤：前向传播、计算损失、反向传播计算梯度、更新权重。假设我们已经完成了前向传播并计算了损失，现在我们要更新某一层的梯度。以下是详细的步骤：

1. 前向传播计算输出

假设你有一个输入 $x$ 和对应的输出 $y$ ，前向传播可以通过神经网络计算出模型的预测输出 $\hat{y}$ 。然后，我们会基于实际的 $y$ 和预测的 $\hat{y}$ 计算损失 $E$ （通常是均方误差或交叉熵）。

2. 反向传播计算梯度

在反向传播中，我们从输出层开始逐层计算梯度，直到到达目标层。这一步的关键是利用链式法则计算每层参数对损失 $E$ 的偏导数。

假设我们有一个中间层 $L$ ，其输入为 $x_{L}$ ，权重为 $W_{L}$ ，激活函数为 $f$ ，输出为 $y_{L} = f (W_{L} \cdot x_{L})$ 。我们关心的是如何更新这一层的权重。

(1) 计算损失对输出的偏导数 $\frac{\partial E}{\partial y_{L}}$

首先，我们需要计算损失对这一层输出 $y_{L}$ 的偏导数。如果 $L$ 层不是输出层，则可以根据下一层的梯度计算得到：

\frac{\partial E}{\partial y_{L}} = \frac{\partial E}{\partial y_{L + 1}} \cdot \frac{\partial y_{L + 1}}{\partial y_{L}}

(2) 计算损失对权重的偏导数 $\frac{\partial E}{\partial W_{L}}$

接下来，我们要计算损失对 $L$ 层权重 $W_{L}$ 的偏导数。通过链式法则，我们可以得到：

\frac{\partial E}{\partial W_{L}} = \frac{\partial E}{\partial y_{L}} \cdot \frac{\partial y_{L}}{\partial W_{L}}

如果 $y_{L} = f (W_{L} \cdot x_{L})$ ，那么：

\frac{\partial y_{L}}{\partial W_{L}} = f^{'} (W_{L} \cdot x_{L}) \cdot x_{L}

所以，最终我们得到：

\frac{\partial E}{\partial W_{L}} = \frac{\partial E}{\partial y_{L}} \cdot f^{'} (W_{L} \cdot x_{L}) \cdot x_{L}

其中 $f^{'}$ 是激活函数 $f$ 的导数。

3. 更新权重

一旦得到了梯度 $\frac{\partial E}{\partial W_{L}}$ ，我们可以使用梯度下降法更新权重。假设学习率为 $η$ ，则更新公式为：

W_{L} := W_{L} - η \cdot \frac{\partial E}{\partial W_{L}}

解释：这一公式表示我们沿着损失函数的负梯度方向调整权重，使得损失逐渐减小，从而提高模型的预测准确度。
学习率 $η$ ：学习率控制步长。步长过大可能会错过最优解，步长过小则训练速度较慢。

4. 反复应用上述步骤

反向传播和权重更新的过程会对每一层重复进行，直到所有层的权重都更新完毕。这一轮的梯度计算和更新完成后，模型的权重就得到了调整。然后，我们继续下一轮训练（即下一批数据），重复上述的前向传播、反向传播和更新步骤。

例子：单层的梯度更新

假设你要更新某个中间层 $L$ 的梯度：

首先计算损失对该层输出 $y_{L}$ 的梯度 $\frac{\partial E}{\partial y_{L}}$ 。
然后，利用链式法则，计算该层权重 $W_{L}$ 的梯度 $\frac{\partial E}{\partial W_{L}}$ 。
使用梯度下降更新权重： $W_{L} := W_{L} - η \cdot \frac{\partial E}{\partial W_{L}}$ 。

小结

更新某一层的梯度的关键步骤包括：

计算每层输出的梯度。
根据每层的输出梯度推导权重的梯度。
使用学习率调整权重。

以上就是更新某一层梯度的完整步骤。如果你还有不理解的地方，或者想了解更具体的计算例子，请告诉我！

Algorithm

Tutorial

assignment

Assignment

As-1

As-2

Lab-1

Lab-2

Lab-3

Lab-4

GAMES101

Assignment-1

Assignment-2

Assignment-3

Assignment-4

Lab

Lecture

Peoject

CSCN

Ploidy

CV-Back Propagation ​

1. 前向传播计算输出 ​

2. 反向传播计算梯度 ​

(1) 计算损失对输出的偏导数∂E∂yL ​

(2) 计算损失对权重的偏导数∂E∂WL ​

3. 更新权重 ​

4. 反复应用上述步骤 ​

例子：单层的梯度更新 ​

小结 ​