BFANet: 3D-Semantische Segmentierung neu betrachtet mit Grenzflächenmerkmalsanalyse

Die 3D-Semantiksegmentierung spielt eine grundlegende und entscheidende Rolle bei der Verständnis von 3D-Szenen. Während moderne state-of-the-art-Techniken sich hauptsächlich darauf konzentrieren, die Gesamtleistung der 3D-Semantiksegmentierung anhand allgemeiner Metriken (z. B. mIoU, mAcc und oAcc) zu verbessern, werden die Herausforderungen in schwierigen Segmentierungsregionen leider weitgehend vernachlässigt. In diesem Artikel greifen wir die 3D-Semantiksegmentierung aus einer feineren Perspektive erneut auf und beleuchten subtile Komplexitäten, die durch herkömmliche, breit angelegte Leistungsmaße oft übersehen werden. Konkret gliedern wir 3D-Semantiksegmentierungsfehler in vier umfassende Kategorien und stellen hierfür jeweils spezifische Evaluationsmetriken vor. Aufbauend auf diesem kategorialen Rahmen stellen wir ein innovatives 3D-Semantiksegmentierungsnetzwerk namens BFANet vor, das eine detaillierte Analyse semantischer Randmerkmale integriert. Zunächst entwerfen wir das Boundary-Semantic-Modul, um Punktwolkenmerkmale in semantische und randbezogene Merkmale zu entkoppeln und deren Query-Queue zu fusions, um die semantischen Merkmale mittels Aufmerksamkeit zu verbessern. Zweitens führen wir einen kompakteren und beschleunigten Algorithmus zur Berechnung von Rand-Pseudolabels ein, der 3,9-mal schneller ist als der aktuell beste Ansatz, kompatibel mit Datenverstärkung ist und eine effiziente Berechnung im Trainingsprozess ermöglicht. Umfangreiche Experimente auf Standarddatensätzen bestätigen die Überlegenheit unseres BFANet-Modells und unterstreichen die Bedeutung der gezielt entwickelten vier Metriken. Der Quellcode ist unter https://github.com/weiguangzhao/BFANet verfügbar.