deeplearning.ai课程学习（3）

第三周：浅层神经网络(Shallow neural networks)

1、激活函数（Activation functions）

sigmoid函数和tanh函数两者共同的缺点是，在z

Relu和Leaky ReLu相对于Sigmoid和tanh函数的优点如下：

第一，在

第二，sigmoid和tanh函数的导数在正负饱和区的梯度都会接近于0，这会造成梯度弥散，而Relu和Leaky ReLu函数大于0部分都为常熟，不会产生梯度弥散现象。(同时应该注意到的是，Relu进入负半区的时候，梯度为0，神经元此时不会训练，产生所谓的稀疏性，而Leaky ReLu不会有这问题)

不同激活函数的过程和结论：

sigmoid激活函数：除了输出层是一个二分类问题基本不会用它。

tanh激活函数：tanh是非常优秀的，几乎适合所有场合。

ReLu激活函数：最常用的默认函数，如果不确定用哪个激活函数，就使用ReLu或者Leaky ReLu。

总结：如果不确定哪一个激活函数效果更好，可以把它们都试试，然后在验证集或者发展集上进行评价。

2、为什么需要非线性激活函数？（why need a nonlinear activation function?）

如果使用线性激活函数或者没有使用一个激活函数，那么无论你的神经网络有多少层一直在做的只是计算线性函数，所以不如直接去掉全部隐藏层。

3、随机初始化（Random+Initialization）

对于逻辑回归，把权重初始化为0当然也是可以的。但是对于一个神经网络，如果把权重或者参数都初始化为0，那么梯度下降将不会起作用。

如上图，假设有两个输入特征n⁰，两个隐藏单元n¹,初始化权重矩阵W¹为0,b¹=0。

前向传播时，a₁¹和a₁²总是会相等，两个激活单元就会相同。

因为两个隐含单元计算同样的函数，当你做反向传播计算时，这会导致d_z¹和d_z²，使得W²也将为0

转载于:https://www.cnblogs.com/kamekin/p/10093670.html

java正则等号转义_转义Java正则表达式中的特殊字符

在Java或任何开源库中是否有任何方法可以转义(不引用)特殊字符(元字符)，以便将其用作正则表达式？这在动态构建正则表达式时非常方便，无需手动转义每个单独的字符 . 例如，考虑一个简单的正则表达式，如 \d+\.\d+ ，它匹配带小数点的数字，如 1

Rabbitmq消息队列详解

文章目录

关于oracle中提取分页数据的想法

在网上经常看到用oracle提取分页数据时喜欢这样写： select userid,Name,rownum_ from ( select row_.*, rownum rownum_ from (SELECT * FROM v_users order by usertype) row_

React 事件绑定与this绑定的几种方式

MDN中对bind()方法的解释 Function.prototype.bind() bind() 方法创建一个新的函数，在 bind() 被调用时，这

pygame 贪吃蛇（简易版）

** pygame 贪吃蛇（简易版） ** 趁着寒假的时间自学了Python，就在b站上找了个视频做了一个贪吃蛇的小游戏，用到了pygame，IDE用的是pycharm。没怎么根据视频做太大的改进，第

数据库总结(一)

说明：本文主要是自己从Github和论坛上查找的资料进行汇总，方便自己梳理知识点附原文章和资源的地址：

【PyCharm】解决新建虚拟环境后pip无法使用问题

文章目录 1.问题描述与解决

Spark大数据处理讲课笔记4.6 Spark SQL数据源 - JDBC

一、Spark SQL读取关系数据库 Spark SQL还可以使用JDBC API从其他关系型数据库读取数据，返回的结果仍然是一个DataFrame，可以很容易地在Spark SQL中处理，或者与其他数据源进行连接查询。二、Spark SQL JDBC连接属性

git https 和ssh 登录方式切换

从ssh切换至https git remote set-url origin(远程仓库名称) https://email/username/ProjectName.git 从https切换至ssh

华为服务器操作系统是什么意思,服务器操作系统指的是什么

服务器操作系统指的是什么内容精选换一换