HyperAIHyperAI
vor 7 Tagen

EfficientPS: Effiziente panoptische Segmentierung

Rohit Mohan, Abhinav Valada
EfficientPS: Effiziente panoptische Segmentierung
Abstract

Das Verständnis der Szene, in der ein autonomes Robotersystem operiert, ist entscheidend für dessen kompetentes Funktionieren. Eine solche Szenenwahrnehmung erfordert die Erkennung von Instanzen von Verkehrsteilnehmern sowie allgemeine Szenen-Semantik, was effektiv durch die Aufgabe der Panoptic-Segmentation adressiert werden kann. In diesem Artikel stellen wir die Efficient Panoptic Segmentation (EfficientPS)-Architektur vor, die einen gemeinsamen Backbone verwendet, der semantisch reichhaltige, mehrskalige Merkmale effizient kodiert und fusioniert. Wir integrieren einen neuen semantischen Kopf, der feine und kontextuelle Merkmale kohärent aggregiert, sowie eine neue Variante von Mask R-CNN als Instanzkopf. Zudem schlagen wir ein neuartiges Panoptic-Fusionsmodul vor, das die Ausgabewerte (Logits) beider Köpfe unserer EfficientPS-Architektur kongruent integriert, um das endgültige Ergebnis der Panoptic-Segmentation zu erzeugen. Darüber hinaus führen wir die KITTI Panoptic Segmentation-Datenbank ein, die panoptische Annotationen für den populären und anspruchsvollen KITTI-Benchmark enthält. Ausführliche Evaluationen auf Cityscapes, KITTI, Mapillary Vistas und dem Indian Driving Dataset zeigen, dass unsere vorgeschlagene Architektur auf allen vier Benchmarks konsistent die neue State-of-the-Art erreicht und gleichzeitig die effizienteste und schnellste Architektur für die Panoptic-Segmentation bislang darstellt.

EfficientPS: Effiziente panoptische Segmentierung | Neueste Forschungsarbeiten | HyperAI