HyperAIHyperAI
vor 13 Tagen

FusionCount: Effiziente Menschenanzahlung durch Multiskalenmerkmalsfusion

Yiming Ma, Victor Sanchez, Tanaya Guha
FusionCount: Effiziente Menschenanzahlung durch Multiskalenmerkmalsfusion
Abstract

Zustandsbestimmende Ansätze für die Menschenanzahlung basieren auf einer Encoder-Decoder-Architektur. Zunächst werden Bilder durch den Encoder verarbeitet, um Merkmale zu extrahieren. Anschließend werden zur Berücksichtigung der Perspektivverzerrung die Merkmalskarten auf der höchsten Ebene zusätzlichen Komponenten zugeführt, um mehrskalige Merkmale zu gewinnen, die dann als Eingabe für den Decoder dienen, um die Dichteverteilung der Menschen zu generieren. In diesen Methoden werden jedoch Merkmale aus früheren Encoding-Stadien untergenutzt, und die mehrskaligen Module können lediglich einen begrenzten Bereich an Empfindlichkeitsfeldern erfassen, was dennoch erhebliche Rechenkosten verursacht. In dieser Arbeit wird eine neuartige Architektur für die Menschenanzahlung (FusionCount) vorgestellt, die die adaptive Fusion einer großen Mehrheit der codierten Merkmale nutzt, anstatt zusätzliche Komponenten zur Gewinnung mehrskaliger Merkmale heranzuziehen. Dadurch kann ein weitaus größeres Spektrum an Empfindlichkeitsfeldgrößen abgedeckt werden, während gleichzeitig die Rechenkosten gesenkt werden. Außerdem wird ein neuer Kanalreduktionsblock eingeführt, der während des Decoding Salienzinformationen extrahiert und die Leistung des Modells weiter verbessert. Experimente an zwei etablierten Benchmark-Datenbanken zeigen, dass unser Modell state-of-the-art-Ergebnisse erzielt, wobei die rechnerische Komplexität reduziert ist.

FusionCount: Effiziente Menschenanzahlung durch Multiskalenmerkmalsfusion | Neueste Forschungsarbeiten | HyperAI