2 个月前

PointMixer: 用于点云理解的MLP-Mixer

Choe, Jaesung ; Park, Chunghyun ; Rameau, Francois ; Park, Jaesik ; Kweon, In So
PointMixer: 用于点云理解的MLP-Mixer
摘要

MLP-Mixer 最近作为卷积神经网络(CNN)和变压器(Transformer)领域的新兴挑战者崭露头角。尽管其结构相比变压器更为简单,但通过引入通道混合多层感知机(Channel-mixing MLPs)和标记混合多层感知机(Token-mixing MLPs)的概念,MLP-Mixer 在视觉识别任务中取得了显著的性能表现。然而,与图像不同的是,点云本质上是稀疏、无序且不规则的,这限制了 MLP-Mixer 在点云理解中的直接应用。在本文中,我们提出了一种通用的点集算子——PointMixer,该算子能够促进非结构化 3D 点之间的信息共享。通过简单地将标记混合多层感知机替换为 softmax 函数,PointMixer 可以在点集内部或之间“混合”特征。因此,PointMixer 可以广泛应用于网络中的集合间混合、集合内混合以及金字塔混合。大量实验表明,PointMixer 在语义分割、分类和点重建任务中相对于基于变压器的方法具有竞争力甚至更优的性能表现。