重点:1.图片的通道数,卷积核的通道要一样。
2.每个卷积核处理图片后,所有通道要相加,得到一个通道
一、单通道图片,单核处理:
卷积核也为单通道:【【1,0,1】
【0,1,1】
【1,0,1】】
二、多通道图片,单核处理:
三.3通道图片,2核处理,输出为2通道:
下面是用卷积层conv处理一个图片x的案例,卷积层可以理解为函数,本质是类
import torch
x = torch.randn(2,1 ,3,2) (2张图片,通道数1单色,高3,宽2)
conv = torch.nn.Conv2d(1 ,8 ,(2,3) ) #此处创建一个卷积层。
输入通道数1,和上面x数据保持一致
输出的通道 8,也就是核的个数,决定了输出数据的通道数,也可以理解为有8个核处理了图片输出8个矩阵。
y=conv(x) #用卷积处理x返回y
y的shape为(2,8,?,?) #还是2张,8通道,高,宽
下面是源代码可以测试:
#2d中所有数据一般都是4维度的
import torch
cov = torch.nn.Conv2d(3, 2, (3, 2), stride=1, padding=1, bias=False)
#(输入通道,核数,(高,宽),滑动步长,周围补0的个数)
x=torch.ones((2,3,2,2)) #(图片张数,通道,高,宽) #输入数据
y=cov(x)
print(y)
print("输出形状:",y.shape) #(张数,通道,高,宽) 这个通道与cov的核数一致
print("权重形状",cov.weight.shape)
#总结:x 有2张图片,处理后 y还是2张,y的通道是卷积处理的结果,取决于卷积层核的数量