HyperAIHyperAI
vor 4 Monaten

GPSFormer: Ein Transformer zur Punktwolkenverarbeitung auf Basis globaler Wahrnehmung und lokaler Strukturpassung

Wang, Changshuo ; Wu, Meiqing ; Lam, Siew-Kei ; Ning, Xin ; Yu, Shangshu ; Wang, Ruiping ; Li, Weijun ; Srikanthan, Thambipillai
GPSFormer: Ein Transformer zur Punktwolkenverarbeitung auf Basis globaler Wahrnehmung und lokaler Strukturpassung
Abstract

Trotz der erheblichen Fortschritte bei den Vortrainingsmethoden für die Verarbeitung von Punktwolken bleibt die direkte Erfassung komplexer Forminformationen aus unregelmäßigen Punktwolken ohne Rückgriff auf externe Daten eine erhebliche Herausforderung. Um dieses Problem zu lösen, schlagen wir GPSFormer vor, einen innovativen Transformer, der auf globaler Wahrnehmung und lokaler Strukturpassung basiert und detaillierte Forminformationen aus Punktwolken mit bemerkenswerter Genauigkeit lernt. Der Kern von GPSFormer besteht aus dem Global Perception Module (GPM) und dem Local Structure Fitting Convolution (LSFConv). Insbesondere nutzt das GPM die adaptive deformierbare Graphkonvolution (ADGConv), um kurzreichweitige Abhängigkeiten zwischen ähnlichen Merkmalen im Merkmalsraum zu identifizieren, und wendet die Multi-Head Attention (MHA) an, um langreichweitige Abhängigkeiten über alle Positionen im Merkmalsraum zu lernen. Dies ermöglicht letztendlich eine flexible Lernmethode für kontextuelle Darstellungen. Inspiriert durch die Taylorreihe haben wir das LSFConv entwickelt, das sowohl niedrigstufige grundlegende als auch hochstufige feinabgestimmte Informationen aus explizit kodierten lokalen geometrischen Strukturen lernt. Durch die Integration von GPM und LSFConv als grundlegenden Komponenten bauen wir GPSFormer auf, einen state-of-the-art Transformer, der globale und lokale Strukturen von Punktwolken effektiv erfassen kann. Ausführliche Experimente bestätigen die Effektivität von GPSFormer in drei Aufgabenbereichen der Punktwolkenverarbeitung: Formklassifikation, Teilsegmentierung und Few-Shot-Lernen. Der Code von GPSFormer ist unter \url{https://github.com/changshuowang/GPSFormer} verfügbar.