2 个月前

R2-MLP:用于多视图3D物体识别的轮转多层感知机

Chen, Shuo ; Yu, Tan ; Li, Ping
R2-MLP:用于多视图3D物体识别的轮转多层感知机
摘要

近期,仅基于多层感知机(MLP)的视觉架构在计算机视觉领域受到了广泛关注。类似MLP的模型在单个2D图像分类任务中,通过减少归纳偏置并无需手工设计的卷积层,达到了具有竞争力的性能。在这项工作中,我们探讨了基于MLP的架构在基于视角的3D物体识别任务中的有效性。我们提出了一种称为循环滚动多层感知机(Round-Roll MLP,简称R$^2$-MLP)的架构。该架构通过考虑不同视角之间补丁的通信,扩展了空间移位MLP主干网络。R$^2$-MLP沿视角维度滚动部分通道,促进了相邻视角之间的信息交换。我们在ModelNet10和ModelNet40数据集上对MLP的结果进行了基准测试,并从多个方面进行了消融实验。实验结果表明,我们的R$^2$-MLP凭借概念上简单的结构,在性能上与现有的最先进方法相当。

R2-MLP:用于多视图3D物体识别的轮转多层感知机 | 最新论文 | HyperAI超神经