MambaOut

MambaOut: Do We Really Need Mamba for Vision? (CVPR 2025)

论文地址:https://github.com/yuweihao/MambaOut

代码地址:https://arxiv.org/pdf/2405.07992

mamba主要被引入解决注意力机制的二次复杂度问题,与基于卷积和注意力的模型相比,Mamba在视觉方面的表现通常令人失望。本文得出了一个结论就是Mamba非常适合具有长序列和自回归特征的任务,由于图像分类和这两种特征都不符合,所以通过堆叠mamba块,同时移除核心token混合器SSM,得到MambaOut模型在ImageNet图像分类任务上超越了所有视觉Mamba模型。