(通俗易懂)可视化详解多通道 & 多通道输入输出卷积代码实现
  XZVAVmlOqzo6 2023年11月02日 42 0

以前对多通道和多通道输入输出的卷积操作不理解,今天自己在草稿纸上画图推理了一遍,终于弄懂了。希望能帮助到大家。

多通道可视化

一通道的2x2矩阵

torch.Size([2,2]) 相当于 torch.Size([1,2,2]),是一通道的2x2矩阵

(通俗易懂)可视化详解多通道 & 多通道输入输出卷积代码实现_多通道

二通道的 2x2矩阵

torch.Size([2,2,2])代表二通道的 2x2矩阵 ,第一个2表示通道

(通俗易懂)可视化详解多通道 & 多通道输入输出卷积代码实现_卷积_02

三通道的2x2x2矩阵

torch.Size([3,2,2,2])

(通俗易懂)可视化详解多通道 & 多通道输入输出卷积代码实现_2d_03

多输入通道代码,输出通道为1的卷积操作代码

代码

import torch
from d2l import torch as d2l
'''
    多输入通道,输出单通道
    for x,k in zip(X,K)是取出每个通道的图像矩阵 和 对应的卷积核。
    对每个通道对应的的像素矩阵和卷积核进行计算最后相加合到一起
'''
def corr2d_multi_in(X,K):
    return sum(d2l.corr2d(x,k) for x,k in zip(X,K))

X = torch.tensor([[[0, 1, 2],
                   [3, 4, 5],
                   [6, 7, 8]],
                  [[1, 2, 3],
                   [4, 5, 6],
                   [7, 8, 9]]])
K = torch.tensor([[[0, 1],
                   [2, 3]],
                  [[1, 2],
                   [3, 4]]])
print(result)
print(result.shape)

输出结果:

tensor([[ 56.,  72.],
        [104., 120.]])
torch.Size([2, 2])

结果可视化

(通俗易懂)可视化详解多通道 & 多通道输入输出卷积代码实现_2d_04

多输入和多输出通道的卷积操作代码

代码

'''多输入和多输出通道'''
def corr2d_multi_in_out(X,K):
    # 注意,没有遍历X,此时的X是大写
    return torch.stack([corr2d_multi_in(X,k) for k in K],0)

K = torch.tensor([[[0, 1],
                   [2, 3]],
                  [[1, 2],
                   [3, 4]]])
K = torch.stack((K,K+1,K+2),0)
K.shape

torch.Size([3, 2, 2, 2])

result = corr2d_multi_in_out(X,K)
print(result)
print(result.shape)
tensor([[[ 56.,  72.],
         [104., 120.]],

        [[ 76., 100.],
         [148., 172.]],

        [[ 96., 128.],
         [192., 224.]]])
torch.Size([3, 2, 2])

可视化

(通俗易懂)可视化详解多通道 & 多通道输入输出卷积代码实现_2d_05

【版权声明】本文内容来自摩杜云社区用户原创、第三方投稿、转载,内容版权归原作者所有。本网站的目的在于传递更多信息,不拥有版权,亦不承担相应法律责任。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@moduyun.com

  1. 分享:
最后一次编辑于 2023年11月08日 0

暂无评论

推荐阅读
  3XDZIv8qh70z   2023年12月23日   25   0   0 2d2d
XZVAVmlOqzo6