2ヶ月前
PointMixer: MLP-Mixerを用いた点群理解
Choe, Jaesung ; Park, Chunghyun ; Rameau, Francois ; Park, Jaesik ; Kweon, In So

要約
MLP-Mixerは、CNNやトランスフォーマーの領域に新たな挑戦者として登場しました。トランスフォーマーと比較して単純であるにもかかわらず、チャネルミキシングMLPとトークンミキシングMLPの概念は、視覚認識タスクにおいて顕著な性能を達成しています。画像とは異なり、点群データは本質的に疎で、順序がなく、不規則であるため、MLP-Mixerを点群理解に直接適用するには制限があります。本論文では、非構造化3Dポイント間での情報共有を促進する普遍的な点集合演算子であるPointMixerを提案します。トークンミキシングMLPをsoftmax関数で単純に置き換えることで、PointMixerは点集合内または集合間で特徴量を「混ぜる」ことができます。これにより、PointMixerはネットワーク内で集合間混合(inter-set mixing)、集合内混合(intra-set mixing)、ピラミッド混合(pyramid mixing)として広く使用できます。多数の実験結果から、PointMixerがセマンティックセグメンテーション、分類、および点再構成においてトランスフォーマーに基づく手法に対して競争力のあるあるいは優れた性能を示していることが明らかになりました。