HyperAIHyperAI
vor 16 Tagen

Ist Tiefe wirklich notwendig für die Detektion auffälliger Objekte?

Jiawei Zhao, Yifan Zhao, Jia Li, Xiaowu Chen
Ist Tiefe wirklich notwendig für die Detektion auffälliger Objekte?
Abstract

Die Erkennung auffälliger Objekte (Salient Object Detection, SOD) ist eine entscheidende und vorbereitende Aufgabe für zahlreiche Anwendungen im Bereich des maschinellen Sehens und hat mit tiefen neuronalen Netzen (deep CNNs) erhebliche Fortschritte gemacht. Die meisten bestehenden Methoden stützen sich hauptsächlich auf RGB-Daten, um auffällige Objekte zu unterscheiden, was in komplexen Szenarien jedoch erhebliche Schwierigkeiten bereitet. Um dieses Problem zu lösen, wurden in jüngster Zeit zahlreiche RGBD-basierte Netzwerke vorgeschlagen, die die Tiefenkarte als eigenständige Eingabe verwenden und die Merkmale mit den RGB-Daten fusionieren. Ausnutzend die Vorteile sowohl der RGB- als auch der RGBD-Methoden, stellen wir einen neuartigen, tiefenbewussten Rahmen für die Erkennung auffälliger Objekte vor, der folgende herausragende Designmerkmale aufweist: 1) Während der Trainingsphase wird ausschließlich Tiefeninformation verwendet, während im Testphase lediglich RGB-Daten als Eingabe dienen. 2) Die SOD-Merkmale werden umfassend mit mehrstufigen, tiefenbewussten Regularisierungen optimiert. 3) Die Tiefeninformation fungiert zudem als fehlergewichtetes Kartenmodell zur Korrektur des Segmentierungsprozesses. Durch die Kombination dieser klugen Designentscheidungen gelingt es uns erstmals, einen einheitlichen, tiefenbewussten Rahmen zu realisieren, der ausschließlich RGB-Daten als Eingabe für die Inferenz nutzt. Dieser Ansatz übertrifft nicht nur die derzeitigen State-of-the-Art-Leistungen auf fünf öffentlichen RGB-SOD-Benchmarks, sondern erzielt zudem auf fünf Benchmarks erheblich bessere Ergebnisse als RGBD-basierte Methoden, und zwar mit geringerem Informationsaufwand und einer leichtgewichtigen Implementierung. Der Quellcode und die Modelle werden öffentlich verfügbar gemacht.

Ist Tiefe wirklich notwendig für die Detektion auffälliger Objekte? | Neueste Forschungsarbeiten | HyperAI