3D-BEVIS: Vogelperspektivische Instanzsegmentierung

Kürzliche Deep-Learning-Modelle erzielen beeindruckende Ergebnisse bei der Analyse von 3D-Szenen, indem sie direkt auf unstrukturierten Punktwolken operieren. Große Fortschritte wurden im Bereich der Objektklassifizierung und semantischen Segmentierung gemacht. Das Aufgabenfeld der Instanzsegmentierung ist jedoch weniger erforscht. In dieser Arbeit stellen wir 3D-BEVIS vor, ein tiefes Lernframework für die 3D-semantische Instanzsegmentierung auf Punktwolken. Unser Modell folgt dem Ansatz früherer vorschlagsfreier Instanzsegmentierungsverfahren und lernt eine Merkmalsverschmelzung, um den gewonnenen Merkmalsraum in semantische Instanzen zu gruppieren. Aktuelle punktbasierte Methoden skalieren linear mit der Anzahl der Punkte, indem sie lokale Teile einer Szene einzeln verarbeiten. Um jedoch durch Clustering Instanzsegmentierung durchzuführen, sind global konsistente Merkmale erforderlich. Deshalb schlagen wir vor, lokale Punktteilgeometrie mit globalen Kontextinformationen aus einer Zwischendarstellung in Vogelperspektive zu kombinieren (bird's-eye view).