摩杜云开发者社区-摩杜云

软件测试

ViT 标签描述

文章 | 极智Paper | YOLOS 通过目标检测重新思考Vision Transformer

公众号[极智视界] 大家好，我是极智视界，本文解读一下YOLOS通过目标检测重新思考VisionTransformer。 Transformer是否能够从纯序列到序列的角度，在仅有的关于二维空间结构知识的情况下，执行二维目标和区域级别的识别？为了回答这个问题，作者提出了YouOnlyLookatOneSequence(YOLOS)，这是一系列基于普通视觉transformer，做尽可能少的修改、区域先验以及目标任务归纳偏置的目标检测模型。作者发现，只在中等大小的ImageNet-1k数据集上预训练的YOLOS就能在具有挑战性的COCO目标检测基准上取得相当有竞争力的性能，如直...

HRODlxSsrDy9 2023年11月02日 33 0 0 YOLOS 深度学习 transformer ViT 目标检测