Command Palette
Search for a command to run...
Multi-source Multi-scale Counting in Extremely Dense Crowd Images
Multi-source Multi-scale Counting in Extremely Dense Crowd Images
Imran Saleemi Haroon Idrees Mubarak Shah Cody Seibert
Zusammenfassung
Wir schlagen vor, mehrere Informationsquellen zu nutzen, um eine Schätzung der Anzahl von Personen in einer extrem dichten Menschenmenge zu berechnen, die in einem einzigen Bild sichtbar ist. Aufgrund von Problemen wie Perspektive, Verdeckung, Komplexität (Clutter) sowie nur wenigen Pixeln pro Person ist eine Zählung durch menschliche Detektion in solchen Bildern nahezu unmöglich. Stattdessen basiert unser Ansatz auf mehreren Quellen, darunter Detektionen von Köpfen mit geringer Zuverlässigkeit, Wiederholung von Texturelementen (unter Verwendung von SIFT) sowie Analyse im Frequenzbereich, um sowohl die Anzahl als auch die zugehörige Zuverlässigkeit der Beobachtung von Individuen in einem Bildbereich zu schätzen. Zweitens wenden wir eine globale Konsistenzbedingung für die Zählungen mittels Markov-Random-Field (MRF) an. Dadurch wird eine Diskrepanz in den Zählungen in lokalen Nachbarschaften sowie über verschiedene Skalen hinweg berücksichtigt. Wir haben unseren Ansatz an einem neuen Datensatz aus fünfzig Bildern mit insgesamt 64.000 annotierten Menschen getestet, wobei die Kopfanzahlen zwischen 94 und 4543 variierten. Dies steht in starkem Gegensatz zu bisherigen Datensätzen, die für existierende Methoden verwendet wurden und jeweils nicht mehr als einige Dutzend Personen enthielten. Experimentell zeigen wir die Wirksamkeit und Zuverlässigkeit des vorgeschlagenen Ansatzes durch eine quantitative Bewertung der Zählleistung.