HyperAIHyperAI
vor 2 Monaten

Objekte als Punkte

Xingyi Zhou; Dequan Wang; Philipp Krähenbühl
Objekte als Punkte
Abstract

Die Objekterkennung identifiziert Objekte als achsenparallele Boxen in einem Bild. Die meisten erfolgreichen Objekterkennungsverfahren erstellen eine fast vollständige Liste potentieller Objektstandorte und klassifizieren jeden davon. Dies ist verschwenderisch, ineffizient und erfordert zusätzliche Nachbearbeitung. In dieser Arbeit gehen wir einen anderen Weg. Wir modellieren ein Objekt als einen einzelnen Punkt – den Mittelpunkt seiner Begrenzungsbox. Unser Detektor verwendet die Schlagpunktschätzung (keypoint estimation), um Mittelpunkte zu finden, und regressiert zu allen anderen Objekteigenschaften, wie z.B. Größe, 3D-Position, Ausrichtung und sogar Pose. Unser Ansatz auf Basis von Mittelpunkten, CenterNet genannt, ist end-to-end differenzierbar, einfacher, schneller und genauer als entsprechende Verfahren auf Basis von Begrenzungsboxen. CenterNet erreicht das beste Leistungs-Akkuratesse-Verhältnis im MS COCO-Datensatz: 28,1 % AP bei 142 FPS, 37,4 % AP bei 52 FPS und 45,1 % AP mit mehrskaliger Testung bei 1,4 FPS. Wir verwenden denselben Ansatz zur Schätzung von 3D-Begrenzungsboxen im KITTI-Benchmark und zur Poseestimation von Menschen im COCO-Schlagpunkt-Datensatz. Unsere Methode erzielt wettbewerbsfähige Ergebnisse mit komplexen Mehrtstufigenverfahren und läuft in Echtzeit.