GPr-Net: Geometrisches Prototypisches Netzwerk für Few-Shot-Lernen von Punktwolken

Im Bereich der 3D-Computer Vision-Anwendungen spielt das Few-Shot-Lernen von Punktwolken eine entscheidende Rolle. Allerdings stellt es aufgrund der Sparsität, Irregularität und Ungeordnetheit der Daten eine erhebliche Herausforderung dar. Aktuelle Methoden basieren auf komplexen lokalen geometrischen Extraktionsverfahren wie Faltung, Graphen und Aufmerksamkeitsmechanismen, sowie auf umfangreichen datengesteuerten Vortrainingsaufgaben. Diese Ansätze widersprechen jedoch dem grundlegenden Ziel des Few-Shot-Lernens, effizientes Lernen zu fördern. Um dieses Problem anzugehen, schlagen wir GPr-Net (Geometrisches Prototypisches Netzwerk) vor, ein leichtgewichtiges und rechnerisch effizientes geometrisches Prototypisches Netzwerk, das die intrinsische Topologie von Punktwolken erfasst und überlegene Leistungen erzielt. Unsere vorgeschlagene Methode, IGI++ (Intrinsic Geometry Interpreter++), verwendet vektorbasierte, manuell erstellte intrinsische Geometrie-Interpretatoren und Laplace-Vektoren zur Extraktion und Bewertung der Morphologie von Punktwolken, was zu verbesserten Repräsentationen für FSL (Few-Shot Learning) führt. Zudem ermöglichen Laplace-Vektoren die Extraktion wertvoller Merkmale aus Punktwolken mit weniger Punkten. Um die Herausforderung der Verteilungsverschiebung im Few-Shot-Metric-Lernen zu bewältigen, nutzen wir den hyperbolischen Raum und zeigen, dass unser Ansatz die innerklassische und zwischenklassische Varianz besser handhabt als bestehende Few-Shot-Lernmethoden für Punktwolken. Experimentelle Ergebnisse am ModelNet40-Datensatz belegen, dass GPr-Net bestehende state-of-the-art-Methoden im Few-Shot-Lernen von Punktwolken übertreffen kann und eine maximale rechnerische Effizienz erreicht, die $170\times$ besser ist als alle bisherigen Arbeiten. Der Quellcode ist öffentlich verfügbar unter https://github.com/TejasAnvekar/GPr-Net.