HyperAIHyperAI
vor 11 Tagen

UniDet3D: Multidataset-Indoor-3D-Objekterkennung

Maksim Kolodiazhnyi, Anna Vorontsova, Matvey Skripkin, Danila Rukhovich, Anton Konushin
UniDet3D: Multidataset-Indoor-3D-Objekterkennung
Abstract

Wachsende Kundenanforderungen an intelligente Lösungen im Bereich der Robotik und erweiterten Realität haben erhebliche Aufmerksamkeit auf die 3D-Objekterkennung aus Punktwolken gelenkt. Dennoch sind bestehende, einzeln betrachtete Innenraum-Datensätze zu klein und unzureichend vielfältig, um ein leistungsfähiges und allgemein gültiges Modell für die 3D-Objekterkennung zu trainieren. Gleichzeitig bleiben allgemeinere Ansätze, die Fundamentmodelle nutzen, in ihrer Qualität weiterhin hinter solchen zurück, die auf einer überwachten Schulung für eine spezifische Aufgabe basieren. In dieser Arbeit präsentieren wir UniDet3D, ein einfaches, jedoch wirksames Modell zur 3D-Objekterkennung, das auf einer Kombination verschiedener Innenraum-Datensätze trainiert wurde und in unterschiedlichen Innenraumumgebungen eingesetzt werden kann. Durch die Vereinheitlichung verschiedener Label-Räume ermöglicht UniDet3D die Lernung einer starken Darstellung über mehrere Datensätze hinweg mittels eines überwachten, gemeinsamen Trainingsansatzes. Die vorgeschlagene Netzwerkarchitektur basiert auf einem grundlegenden Transformer-Encoder, was die Ausführung, Anpassung und Erweiterung der Vorhersagepipeline für praktische Anwendungen vereinfacht. Umfangreiche Experimente zeigen, dass UniDet3D gegenüber bestehenden Methoden zur 3D-Objekterkennung erhebliche Verbesserungen in sechs Innenraum-Benchmarks erzielt: ScanNet (+1,1 mAP50), ARKitScenes (+19,4 mAP25), S3DIS (+9,1 mAP50), MultiScan (+9,3 mAP50), 3RScan (+3,2 mAP50) und ScanNet++ (+2,7 mAP50). Der Quellcode ist unter https://github.com/filapro/unidet3d verfügbar.

UniDet3D: Multidataset-Indoor-3D-Objekterkennung | Neueste Forschungsarbeiten | HyperAI