HyperAIHyperAI
vor 2 Monaten

IAM: Verbesserung der RGB-D-Instanzsegmentierung durch neue Benchmarks

Jung, Aecheon ; Choi, Soyun ; Min, Junhong ; Hong, Sungeun
IAM: Verbesserung der RGB-D-Instanzsegmentierung durch neue Benchmarks
Abstract

Die Bildsegmentierung ist eine wichtige Aufgabe zur Bereitstellung von menschlicher Unterstützung und zur Steigerung der Autonomie in unserem Alltag. Insbesondere hat die RGB-D-Segmentierung, die sowohl visuelle als auch tiefenbasierte Hinweise nutzt, zunehmendes Interesse geweckt, da sie ein reicheres Szenenverständnis verspricht als Methoden, die sich nur auf RGB-Bilder stützen. Dennoch haben die meisten bisherigen Bemühungen sich hauptsächlich auf die semantische Segmentierung konzentriert und damit eine kritische Lücke gelassen. Es gibt eine relative Knappheit an instanzbasierten RGB-D-Segmentierungsdatensätzen, was bestehende Methoden dazu führt, sich auf breite Kategorien zu beschränken, anstatt die feingranularen Details zu erfassen, die für die Erkennung einzelner Objekte erforderlich sind. Um diese Lücke zu schließen, stellen wir drei RGB-D-Instanzsegmentierungsbenchmarks vor, die auf der Instanzebene differenzieren. Diese Datensätze sind vielseitig und unterstützen eine breite Palette von Anwendungen, von Indoor-Navigation bis hin zur Robotermanipulation. Darüber hinaus präsentieren wir eine umfangreiche Bewertung verschiedener Baselinemodelle auf diesen Benchmarks. Diese detaillierte Analyse identifiziert sowohl deren Stärken als auch Schwächen und leitet zukünftige Arbeiten in Richtung robusterer und allgemeinerer Lösungen. Schließlich schlagen wir eine einfache aber effektive Methode zur Integration von RGB-D-Daten vor. Umfangreiche Evaluierungen bestätigen die Effektivität unseres Ansatzes und bieten einen robusten Rahmen für den Fortschritt hin zu einem nuancierteren Szenenverständnis.

IAM: Verbesserung der RGB-D-Instanzsegmentierung durch neue Benchmarks | Neueste Forschungsarbeiten | HyperAI