摩杜云开发者社区-摩杜云

（Arxiv-2021）掩码自编码器是可扩展的视觉学习者

掩码自编码器是可扩展的视觉学习者 paper题目：MaskedAutoencodersAreScalableVisionLearners paper是FAIR发表在arxiv2021的工作 paper地址：链接 Abstract 本文表明，掩码自编码器(MAE)是用于计算机视觉的可扩展自监督学习器。MAE方法很简单：屏蔽输入图像的随机patch并重建丢失的像素。它基于两个核心设计。首先，开发了一个非对称的编码器-解码器架构，其中一个编码器只对可见的patch子集（没有掩码tokens）进行操作，以及一个轻量级解码器，它从潜在表示和掩码tokens重建原始图像。其次，作者发现屏蔽输...

QcFP3KMgrGd1 2023年11月02日 41 0 0 编码器数据编码器计算机视觉深度学习数据计算机视觉神经网络深度学习神经网络

关注更多

空空如也 ~ ~

粉丝更多

空空如也 ~ ~