HyperAIHyperAI
vor 2 Monaten

CSRNet: Dilatationskonvolutionelle Neuronale Netze für das Verstehen hoch frequentierter Szenen

Yuhong Li; Xiaofan Zhang; Deming Chen
CSRNet: Dilatationskonvolutionelle Neuronale Netze für das Verstehen hoch frequentierter Szenen
Abstract

Wir schlagen ein Netzwerk für die Erkennung von stark frequentierten Szenen vor, das CSRNet genannt wird. CSRNet soll eine datengetriebene und tiefes Lernverfahren bieten, das hoch frequente Szenen verstehen und eine genaue Schätzung der Anzahl sowie hochwertige Dichtekarten erstellen kann. Das vorgeschlagene CSRNet besteht aus zwei Hauptkomponenten: einem Faltungsneuronalen Netzwerk (CNN) als Frontend zur 2D-Feature-Extraktion und einem dilatierten CNN als Backend, das dilatierte Kerne verwendet, um größere Rezeptionsfelder zu erzeugen und Pooling-Operationen zu ersetzen. CSRNet ist ein leicht trainierbares Modell aufgrund seiner rein faltungsnetzbasierten Struktur. Wir demonstrieren die Leistungsfähigkeit von CSRNet anhand von vier Datensätzen (ShanghaiTech-Datensatz, UCF_CC_50-Datensatz, WorldEXPO'10-Datensatz und UCSD-Datensatz) und erzielen dabei den aktuellen Stand der Technik. Im ShanghaiTech Part_B-Datensatz erreicht CSRNet einen durchschnittlichen absoluten Fehler (MAE), der um 47,3 % niedriger ist als der bislang beste Ansatz. Wir erweitern die Anwendungsbereiche von CSRNet auch auf die Zählung anderer Objekte, wie zum Beispiel Fahrzeuge im TRANCOS-Datensatz. Die Ergebnisse zeigen, dass CSRNet die Ausgabequalität erheblich verbessert, wobei der MAE um 15,4 % niedriger ist als bei dem bisher besten Verfahren.

CSRNet: Dilatationskonvolutionelle Neuronale Netze für das Verstehen hoch frequentierter Szenen | Neueste Forschungsarbeiten | HyperAI