Abstoßender Verlust: Erkennen von Fußgängern in einer Menschenmenge

Die Erkennung einzelner Fußgänger in einer Menschenmenge stellt weiterhin eine herausfordernde Aufgabe dar, da die Fußgänger in realen Szenarien häufig zusammenstehen und sich gegenseitig verdecken. In dieser Arbeit untersuchen wir zunächst durch Experimente, wie ein moderner Fußgängererkennungsalgorithmus durch die Verdeckung in der Menge beeinträchtigt wird, was Einblicke in das Problem der Verdeckung in der Menge bietet. Anschließend schlagen wir einen neuen Bounding-Box-Regression-Verlust vor, der speziell für Menschenmengenszenarien entwickelt wurde und als "Abstoßungsverlust" (repulsion loss) bezeichnet wird. Dieser Verlust wird von zwei Motivationen geleitet: der Anziehungskraft des Ziels und dem Abstoßen durch andere umliegende Objekte. Der Abstoßungsterm verhindert, dass das Vorschlagsfenster zu anderen umliegenden Objekten verschoben wird, wodurch eine robuster geortete Positionierung in dichten Mengen erreicht wird. Unser mit dem Abstoßungsverlust trainierter Erkennungsalgorithmus übertrifft alle aktuellen Methoden bei erheblichem Fortschritt im Umgang mit Verdeckungsfällen.