掩码自编码器是可扩展的视觉学习者 paper题目:MaskedAutoencodersAreScalableVisionLearners paper是FAIR发表在arxiv2021的工作 paper地址:​​链接​​ Abstract 本文表明,掩码自编码器(MAE)是用于计算机视觉的可扩展自监督学习器。MAE方法很简单:屏蔽输入图像的随机patch并重建丢失的像素。它基于两个核心设计。首先,开发了一个非对称的编码器-解码器架构,其中一个编码器只对可见的patch子集(没有掩码tokens)进行操作,以及一个轻量级解码器,它从潜在表示和掩码tokens重建原始图像。其次,作者发现屏蔽输...

关注 更多

空空如也 ~ ~

粉丝 更多

空空如也 ~ ~