HyperAIHyperAI

Command Palette

Search for a command to run...

MSTA3D: Mehrskalige Doppelaufmerksamkeit für die 3D-Instanzsegmentierung

Zusammenfassung

Kürzlich haben transformerbasierte Techniken, die Superpunkte einbeziehen, in der 3D-Instanzsegmentierung an Bedeutung gewonnen. Diese Ansätze stoßen jedoch oft auf das Problem der Übersegmentierung, insbesondere bei großen Objekten. Zudem verstärken unzuverlässige Maskenprognosen, die aus der Superpunkt-Maskenprognose resultieren, dieses Problem weiter. Um diesen Herausforderungen entgegenzutreten, schlagen wir einen neuen Rahmenwerk namens MSTA3D vor. Dieses nutzt eine mehrskalige Merkmalsrepräsentation und führt einen Doppelaufmerksamkeitsmechanismus ein, um diese effektiv zu erfassen. Darüber hinaus integriert MSTA3D eine Box-Abfrage mit einem Box-Regularisierer, was neben semantischen Abfragen eine ergänzende räumliche Restriktion bietet. Experimentelle Auswertungen an den Datensätzen ScanNetV2, ScanNet200 und S3DIS zeigen, dass unser Ansatz den aktuellen Stand der Technik in der 3D-Instanzsegmentierung übertrifft.


KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren
Sofort einsatzbereite GPUs
Die besten Preise

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp