HyperAIHyperAI
vor 13 Tagen

Verteilungsanpassung für die Menschenanzahlung

Boyu Wang, Huidong Liu, Dimitris Samaras, Minh Hoai
Verteilungsanpassung für die Menschenanzahlung
Abstract

Bei der Menschenanzahlung (crowd counting) enthält jedes Trainingsbild mehrere Personen, wobei jede Person durch einen Punkt annotiert ist. Bestehende Methoden zur Menschenanzahlung müssen eine Gaußverteilung zur Glättung jedes annotierten Punkts verwenden oder die Wahrscheinlichkeit jedes Pixels unter der Annahme des annotierten Punkts schätzen. In diesem Artikel zeigen wir, dass die Anwendung von Gaußverteilungen auf die Annotationen die Verallgemeinerungsfähigkeit beeinträchtigt. Stattdessen schlagen wir eine Methode namens Distribution Matching for crowd COUNTing (DM-Count) vor. Bei DM-Count verwenden wir die optimale Transporttheorie (Optimal Transport, OT), um die Ähnlichkeit zwischen dem normalisierten vorhergesagten Dichtekarte und der normalisierten Ground-Truth-Dichtekarte zu messen. Um die Stabilität der OT-Berechnung zu gewährleisten, integrieren wir eine Total Variation-Verlustfunktion in unser Modell. Wir zeigen, dass die Verallgemeinerungsfehlergrenze von DM-Count enger ist als die von Methoden mit geglätteten Gauß-Annotationen. In Bezug auf den mittleren absoluten Fehler (Mean Absolute Error) übertrifft DM-Count die bisher beste State-of-the-Art-Methode deutlich auf zwei großen Datensätzen, UCF-QNRF und NWPU, und erreicht die derzeit besten Ergebnisse auf den Datensätzen ShanghaiTech und UCF-CC50. DM-Count reduziert den Fehler des bisher veröffentlichten State-of-the-Art-Ergebnisses um etwa 16 %. Der Quellcode ist unter https://github.com/cvlab-stonybrook/DM-Count verfügbar.

Verteilungsanpassung für die Menschenanzahlung | Neueste Forschungsarbeiten | HyperAI