HyperAIHyperAI
vor 2 Monaten

DualPoseNet: Kategorieniveau-6D-Objekt-Pose- und Größenabschätzung unter Verwendung eines Dualen Pose-Netzwerks mit verfeinerter Lernmethode für Pose-Konsistenz

Lin, Jiehong ; Wei, Zewei ; Li, Zhihao ; Xu, Songcen ; Jia, Kui ; Li, Yuanqing
DualPoseNet: Kategorieniveau-6D-Objekt-Pose- und Größenabschätzung unter Verwendung eines Dualen Pose-Netzwerks mit verfeinerter Lernmethode für Pose-Konsistenz
Abstract

Die Kategorieebenen-Schätzung von 6D-Objekt-Pose und -Größe besteht darin, vollständige Pose-Konfigurationen von Rotation, Translation und Größe für Objektinstanzen in einzelnen, beliebigen Ansichten von verstreuten Szenen vorherzusagen. In dieser Arbeit schlagen wir eine neue Methode vor, die als Dual Pose Network mit verfeinerter Lernung der Posenkonsistenz bezeichnet wird und kurz DualPoseNet genannt wird. DualPoseNet stapelt zwei parallele Pose-Decodier auf einem gemeinsamen Pose-Encodier, wobei der implizite Decodier Objektposen mit einem Arbeitsmechanismus vorhersagt, der sich vom expliziten Decodier unterscheidet; sie erlegen daher ergänzende Überwachung bei der Trainierung des Encodiers. Wir bauen den Encodier auf sphärischen Faltungen (spherical convolutions) auf und entwerfen ein Modul der Sphärischen Fusion (Spherical Fusion), das eine bessere Einbettung von posensensitiven Merkmalen aus Erscheinungs- und Formbeobachtungen ermöglicht. Ohne Test-CAD-Modelle ist es die neuartige Einführung des impliziten Decodiers, die während des Testens durch eine selbstanpassende Verlustfunktion die Konsistenz der vorhergesagten Posen zwischen den beiden Decodiern erzwingt und so eine verfeinerte Posenvorhersage ermöglicht. Ausführliche Experimente an Benchmarks sowohl für kategorie- als auch für instanzbasierte Objekt-Pose-Datensätze bestätigen die Effektivität unserer Designs. DualPoseNet übertrifft bestehende Methoden bei hoher Präzision um einen großen Vorsprung. Unser Code ist öffentlich unter https://github.com/Gorilla-Lab-SCUT/DualPoseNet verfügbar.

DualPoseNet: Kategorieniveau-6D-Objekt-Pose- und Größenabschätzung unter Verwendung eines Dualen Pose-Netzwerks mit verfeinerter Lernmethode für Pose-Konsistenz | Neueste Forschungsarbeiten | HyperAI