HyperAIHyperAI

Command Palette

Search for a command to run...

Skalierungsaggregationsnetzwerk für präzise und effiziente Menschenzählung

Zhipeng Wang Xinkun Cao Fei Su Yanyun Zhao

Zusammenfassung

In diesem Paper stellen wir ein neuartiges Encoder-Decoder-Netzwerk namens Scale Aggregation Network (SANet) für eine präzise und effiziente Menschenansammlungszählung vor. Der Encoder extrahiert mehrskalige Merkmale mittels Skalenaggregationseinheiten, während der Decoder hochauflösende Dichtekarten durch eine Reihe von transponierten Faltungen erzeugt. Darüber hinaus stellen wir fest, dass die meisten bestehenden Ansätze lediglich die euklidische Verlustfunktion verwenden, die die Unabhängigkeit jedes einzelnen Pixels annimmt, jedoch die lokale Korrelation in Dichtekarten vernachlässigt. Daher schlagen wir einen neuartigen Trainingsverlust vor, der die euklidische Verlustfunktion mit einer lokalen Musterkonsistenzverlustfunktion kombiniert, wodurch sich in unseren Experimenten eine verbesserte Modellleistung ergibt. Zudem nutzen wir Normalisierungsschichten, um den Trainingsprozess zu erleichtern, und implementieren ein patchbasiertes Testverfahren, um die Auswirkungen des statistischen Shift-Problems zu reduzieren. Um die Wirksamkeit des vorgeschlagenen Ansatzes zu demonstrieren, führen wir umfangreiche Experimente auf vier zentralen Datensätzen zur Menschenansammlungszählung durch. Unser Verfahren erreicht dabei eine überlegene Leistung im Vergleich zu aktuellen State-of-the-Art-Methoden, und zwar mit deutlich weniger Parametern.


KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren
Sofort einsatzbereite GPUs
Die besten Preise

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp