HyperAIHyperAI
vor 17 Tagen

Zählung von Menschenmengen durch adversarische, kreuzskalige Konsistenzverfolgung

{Xiaokang Yang, Bingbing Ni, Zan Shen, Jianguo Hu, Yi Xu, Minsi Wang}
Zählung von Menschenmengen durch adversarische, kreuzskalige Konsistenzverfolgung
Abstract

Die Schätzung von Menschenmengen (Crowd Counting) oder Dichteschätzungen stellt aufgrund erheblicher Skalenvariationen, perspektivischer Verzerrungen sowie starker Verdeckungen eine herausfordernde Aufgabe im Bereich der Computer Vision dar. Bestehende Methoden leiden generell an zwei Problemen: Erstens wirkt sich die weit verbreitete L2-Regressionsverlustfunktion in Multi-Scale-CNNs negativ auf die Modellmittelung aus, und zweitens führt sie zu inkonsistenten Schätzungen bei unterschiedlichen Eingabeskalen. Um diese Herausforderungen explizit anzugehen, schlagen wir einen neuartigen Ansatz für die Schätzung von Menschenmengen (Dichteschätzung) vor, namens Adversarial Cross-Scale Consistency Pursuit (ACSCP). Auf der einen Seite wird ein U-Net-ähnliches Netzwerk entworfen, das aus einem Eingabepatch eine Dichtekarte generiert; zudem wird ein adversarialer Verlust eingesetzt, um die Lösung auf einen realistischen Teilraum zu beschränken und somit die unscharfen Effekte der Dichteschätzung zu verringern. Auf der anderen Seite entwickeln wir einen neuen Skalenkonsistenz-Regularisierer, der sicherstellt, dass die Summe der Personenanzahlen aus lokalen Patchen (niedrige Skala) mit der Gesamtanzahl der Personen in der Vereinigung dieser Regionen (hohe Skala) konsistent ist. Diese beiden Verlustfunktionen werden über ein gemeinsames Trainingsverfahren integriert, um die Leistung der Dichteschätzung durch eine tiefere Exploration der Zusammenarbeit zwischen beiden Zielen zu verbessern. Umfassende Experimente an vier Benchmark-Datensätzen belegen eindrucksvoll die Wirksamkeit der vorgeschlagenen Innovationen sowie die überlegene Leistung gegenüber bestehenden Verfahren.