HyperAIHyperAI

Command Palette

Search for a command to run...

Beta R-CNN: Ein Blick auf die Fußgängerdetektion aus einer anderen Perspektive

Zixuan Xu Banghuai Li Ye Yuan Anhong Dang

Zusammenfassung

In jüngster Zeit wurden erhebliche Fortschritte bei der Fußgängererkennung erzielt, dennoch bleibt die Erzielung hoher Leistung in durchsichtigen und überfüllten Szenen herausfordernd. Dies lässt sich hauptsächlich auf die weit verbreitete Darstellung von Fußgängern zurückführen, nämlich die 2D achsenparallele Umrandung (axis-aligned bounding box), die lediglich die ungefähre Position und Größe des Objekts beschreibt. Die Umrandung modelliert das Objekt als gleichmäßige Verteilung innerhalb der Grenzen, wodurch Fußgänger in durchsichtigen und überfüllten Szenen aufgrund starker Störungen nicht mehr unterscheidbar sind. Um dieses Problem zu beheben, schlagen wir eine neuartige Darstellung basierend auf der 2D-Beta-Verteilung vor, die wir Beta-Darstellung (Beta Representation) nennen. Diese stellt einen Fußgänger explizit durch die Konstruktion der Beziehung zwischen vollständiger Körperumrandung und sichtbarer Umrandung dar und betont den Schwerpunkt der visuellen Masse, indem unterschiedlichen Pixeln unterschiedliche Wahrscheinlichkeitswerte zugewiesen werden. Dadurch ist die Beta-Darstellung besonders gut geeignet, stark überlappende Instanzen in überfüllten Szenen zu unterscheiden, insbesondere in Verbindung mit einer neuen NMS-Strategie namens BetaNMS. Darüber hinaus wird ein neuartiger Pipeline-Ansatz, Beta R-CNN, vorgestellt, der mit BetaHead und BetaMask ausgestattet ist, um die volle Leistungsfähigkeit der Beta-Darstellung auszuschöpfen und somit eine herausragende Erkennungsleistung auch in durchsichtigen und überfüllten Szenen zu erzielen.


KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren
Sofort einsatzbereite GPUs
Die besten Preise

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp
Beta R-CNN: Ein Blick auf die Fußgängerdetektion aus einer anderen Perspektive | Paper | HyperAI