HyperAIHyperAI
vor 2 Monaten

R2-MLP: Round-Roll MLP für die Mehrsicht-3D-Objekterkennung

Chen, Shuo ; Yu, Tan ; Li, Ping
R2-MLP: Round-Roll MLP für die Mehrsicht-3D-Objekterkennung
Abstract

Kürzlich haben visuelle Architekturen, die ausschließlich auf mehrschichtigen Perzeptronen (MLPs) basieren, in der Computer Vision Gemeinschaft viel Aufmerksamkeit erhalten. MLP-ähnliche Modelle erreichen wettbewerbsfähige Leistungen bei der Klassifikation von einzelnen 2D-Bildern mit weniger induktiver Verzerrung und ohne manuell gestaltete Faltungsschichten. In dieser Arbeit untersuchen wir die Effektivität einer MLP-basierten Architektur für die view-basierte 3D-Objekterkennung. Wir stellen eine MLP-basierte Architektur vor, die als Round-Roll MLP (R$^2$-MLP) bezeichnet wird. Diese erweitert das räumliche Shift-MLP-Backbone-Modell, indem sie die Kommunikation zwischen Patchs aus verschiedenen Ansichten berücksichtigt. Das R$^2$-MLP rollt einen Teil der Kanäle entlang der Ansichtsdimension und fördert den Informationsaustausch zwischen benachbarten Ansichten. Wir evaluieren die Ergebnisse des MLPs auf den Datensätzen ModelNet10 und ModelNet40 unter Berücksichtigung verschiedener Aspekte. Die experimentellen Ergebnisse zeigen, dass unser R$^2$-MLP mit einer konzeptionell einfachen Struktur eine wettbewerbsfähige Leistung im Vergleich zu bestehenden Stand-of-the-Art-Methoden erzielt.

R2-MLP: Round-Roll MLP für die Mehrsicht-3D-Objekterkennung | Neueste Forschungsarbeiten | HyperAI