SL3D: Selbstüberwachte-Selbstbeschriftete 3D-Erkennung

Tiefes Lernen hat in vielen 3D-Visualkerkanntauffgaben, einschließlich Formklassifizierung, Objekterkennung und semantischer Segmentierung, bemerkenswerte Erfolge erzielt. Viele dieser Ergebnisse basieren jedoch auf der manuellen Sammlung dicht annotierter realer 3D-Daten, die sehr zeitaufwendig und teuer zu gewinnen sind, was die Skalierbarkeit von 3D-Erkennungsaufgaben einschränkt. Daher untersuchen wir die unüberwachte 3D-Erkennung und schlagen ein Framework für selbstüberwachtes und selbstbeschriftetes 3D-Lernen (Self-supervised-Self-Labeled 3D Recognition, SL3D) vor. SL3D löst gleichzeitig zwei gekoppelte Ziele: Clustering und das Lernen von Merkmalsrepräsentationen, um pseudobeschriftete Daten für die unüberwachte 3D-Erkennung zu generieren. SL3D ist ein generisches Framework und kann zur Lösung verschiedener 3D-Erkennungsaufgaben eingesetzt werden, darunter Klassifizierung, Objekterkennung und semantische Segmentierung. Umfangreiche Experimente belegen seine Effektivität. Der Quellcode ist unter https://github.com/fcendra/sl3d verfügbar.