HyperAIHyperAI
vor 17 Tagen

Lernen eines neuronalen Löseverfahrens für die mehrfache Objektverfolgung

{ Laura Leal-Taixe, Guillem Braso}
Lernen eines neuronalen Löseverfahrens für die mehrfache Objektverfolgung
Abstract

Graphen bieten eine natürliche Möglichkeit, das Mehrobjektverfolgungsproblem (Multiple Object Tracking, MOT) innerhalb des Tracking-by-Detection-Paradigmas zu formulieren. Gleichzeitig bringen sie jedoch eine erhebliche Herausforderung für Lernmethoden mit sich, da die Definition eines Modells, das auf solch strukturierten Domänen operieren kann, keineswegs trivial ist. Infolge dessen konzentrierte sich der Großteil der lernbasierten Ansätze auf die Verbesserung von Merkmalen für MOT und nutzte diese anschließend in etablierten Optimierungsframeworks. In dieser Arbeit nutzen wir die klassische Netzwerkflussformulierung von MOT, um einen vollständig differenzierbaren Rahmen basierend auf Message Passing Networks (MPNs) zu entwickeln. Durch die direkte Arbeit auf der Graphendomäne kann unser Ansatz global über eine gesamte Menge an Detektionen hinweg reasoning betreiben und endgültige Lösungen vorhersagen. Dadurch zeigen wir, dass Lernen in MOT nicht auf die Merkmalsextraktion beschränkt sein muss, sondern auch auf den Schritt der Datenassoziation angewendet werden kann. Wir erreichen eine signifikante Verbesserung sowohl in Bezug auf MOTA als auch auf IDF1 auf drei öffentlich verfügbaren Benchmarks. Unser Code ist unter https://bit.ly/motsolv verfügbar.

Lernen eines neuronalen Löseverfahrens für die mehrfache Objektverfolgung | Neueste Forschungsarbeiten | HyperAI