首页 1 2 3 4 5 6 7

cnn 反向传播推导_深度学习|反向传播算法（BP）原理推导及代码实现

03

—

BP算法推导

3.1 公式1

如下图所示，有个精灵跑到了网络中，假设位于第L层，第 j 个神经元的门口处，它引起了一点扰动，

，

z的含义是加权输入项，容易得出这个扰动项对成本函数造成的损失可以定义为：

那么，类推的，可以看出在输出层 L，误差项的定义表达为如下，第一个公式

上式是根据链式规则可以推导得出，成本函数的改变首先是有第L层第j个神经元的输出项影响的，然后第 j 个神经元的输出又受到第 L层第 j 个神经元的干扰 z 影响，因此得到上式。这个式子的意义是定义了第 L层第 j个神经元的误差项怎么求，注意这里L可是输出层哦，那么如何求出第 L-1层中某个神经元的损失项(误差项)呢？

3.2 公式2

这就用到第二个公式，它给出了怎么由第 L层的误差推导出第L-1层的误差，先给出第二个公式：

那么，这个公式，是如何得出的呢？这里面，这个公式是相对最难想的，推导过程如下：

还是从损失项的定义入手，

由以上这几个式子，就可以得出公式2 。

3.3 公式3

那么有了以上的分析，我们便能求解处任意层的损失项了，可以得出成本函数对某层某个神经元的梯度为，这是第三个公式：

还是可以由链式规则得出吧，如下推导过程：

3.4 公式4

成本函数对权重参数的梯度为，这是第四个公式：

那么这个公式还是可以由链式规则得出，对其推导如下：

推导第三，四个公式，都用到了以下这个基本知识：

3.5 反向传播代码

根据这四个公式，可以得出BP算法的代码，每个步骤将公式放到上面，方便查看。

def backprop(self, x, y):

01 占位

nabla_b = [np.zeros(b.shape) for b in self.biases]

nabla_w = [np.zeros(w.shape) for w in self.weights]

02前向传播求出每个神经元的输出项

activation = x

activations = [x] # 分层存储每层的输出项(对应上文中的 a)

zs = [] # 分层存储每层的 z 向量(对应上文中的 z)

for b, w in zip(self.biases, self.weights):

z = np.dot(w, activation)+b

zs.append(z)

activation = sigmoid(z)

activations.append(activation)

#activations[-1] 必须是最后一层

delta = self.cost_derivative(activations[-1], y) *sigmoid_prime(zs[-1])

03 求偏置量的梯度

nabla_b[-1] = delta

04 求权重参数的梯度

nabla_w[-1] = np.dot(delta, activations[-2].transpose())

05 反向传播，依次更新每层的每个神经元的权重和偏移量

# L = 1 表示最后一层神经元， L = 2 倒数第二层神经元

for layer in range(2, self.num_layers):

z = zs[-layer]

sp = sigmoid_prime(z) #sigmoid函数的导数

delta = np.dot(self.weights[-layer+1].transpose(), delta) * sp

nabla_b[-layer] = delta

nabla_w[-layer] = np.dot(delta, activations[-layer-1].transpose())

return (nabla_b, nabla_w)

def cost_derivative(self, output_activations, y):

"""

"""

return (output_activations-y)

解读Shopify财报：亏损持续扩大，和亚马逊的蜜月期要结束了？

Shopify于10月29日发布了2019年第三季度财报，数据表明，其营收为3.906亿美元，同比上涨45%，净亏损为3570万美元，同比扩大。从财务数据上看，Shopify表现一般，受财报发布影响，其股价在周二收跌3.82%。经过十多年的发展，Shopify从一家工具企业成

SkyEye与Jenkins的DevOps持续集成解决方案

在技术飞速发展的当下，随着各行各业的软件逻辑复杂程度提升带来的需求变更，传统测试已无法满足与之相对应的一系列测试任务，有必要引入一个自动化、可持续集成构建的DevOps平台来解决此类问题。本文将主要介绍SkyEye与Jenkins的持续集成解决方案。何谓DevOps

ASP时间函数获取服务器时间和相关…

一、下面先简单介绍一下常用的ASP时间函数： 1、now() 获取当前系

安卓cordove插件开发指导(android plugin development guide)

本文翻译自一下链接原文

Delphi控件cxGrid 如何动态创建列?

var i: Integer; Column: TcxGridDBColumn; cxView: TcxGridDBTableView; begin cxView := Self.Levels[0].GridView as TcxGridDB

python办公自动化之word写入

学习目标：掌握python对word的基本操作学习内容：

java spring qualifier_java – Spring构造函数@Autowired和@Qualifier失...

简化代码(我使用的是Spring 3.1.4). 这是我想要自动装配的课程： public class MyCoolClass { @Autowired public MyCoolClass( @Qualifi

【Kubernetes运维篇】污点、容忍度与Pod重启策略详解

文章目录一

python（进阶篇）：正则表达式常用语法

活动地址：

React中事件绑定的几种写法

使用.bind(this) .bind(this)是最常用的绑定方式，直接手动绑定到this上在使用位置绑定