CNN原理详解
- 首先什么是卷积神经网络(CNN)?
起源就不说了,一搜一大片。是用于图像领域的一种包含卷积计算且具有深度结构的前馈神经网络。图像的尺寸称为图像分辨率,分辨率是数字图像可辨别的最小细节。也就是说图像本是又一个一个颜色颗粒排列组合所看到的宏观效果。直接上图对比。
单通道的数字图像被称为灰度图。通常单通道记录了采样点的亮度信息。
通过一种卷积操作进行提取特征(与RNN的差别就先不在这里讲了),最终使模型学习这种位置之间的关系,来进行识别预测等等(三通道图所载有的特征会更多)。
1. 卷积神经网络的架构
2. 卷积神经网络的层级结构
- 数据输入层/ Input layer
- 卷积计算层/ CONV layerReLU
- 激励层 / ReLU layer
- 池化层 / Pooling layer
- 全连接层 / FC layer
3. 层级详情
1. 数据输入层
- 就是一些前期的特征工程类,去均值,归一化,PCA/奇异值分解等特征预处理操作
2. 卷积计算层
- 如下图,卷积过程
最大的蓝色图(5x5)是原始图
而在原始图中滑动的深蓝色(3x3)右下角的小字是原始图的卷积核(下入就是卷积核)
最后绿色的是原始图经过卷积核卷积后生成的特征图
卷积操作就是卷积核每滑动一次,就对应位置相乘,在就和就得到了特征图矩阵
衍生出 步长,卷积核大小,周围0填充 可变
*优点:*局部感知、参数共享