HyperAIHyperAI
vor 11 Tagen

Beta R-CNN: Ein Blick auf die Fußgängerdetektion aus einer anderen Perspektive

Zixuan Xu, Banghuai Li, Ye Yuan, Anhong Dang
Beta R-CNN: Ein Blick auf die Fußgängerdetektion aus einer anderen Perspektive
Abstract

In jüngster Zeit wurden erhebliche Fortschritte bei der Fußgängererkennung erzielt, dennoch bleibt die Erzielung hoher Leistung in durchsichtigen und überfüllten Szenen herausfordernd. Dies lässt sich hauptsächlich auf die weit verbreitete Darstellung von Fußgängern zurückführen, nämlich die 2D achsenparallele Umrandung (axis-aligned bounding box), die lediglich die ungefähre Position und Größe des Objekts beschreibt. Die Umrandung modelliert das Objekt als gleichmäßige Verteilung innerhalb der Grenzen, wodurch Fußgänger in durchsichtigen und überfüllten Szenen aufgrund starker Störungen nicht mehr unterscheidbar sind. Um dieses Problem zu beheben, schlagen wir eine neuartige Darstellung basierend auf der 2D-Beta-Verteilung vor, die wir Beta-Darstellung (Beta Representation) nennen. Diese stellt einen Fußgänger explizit durch die Konstruktion der Beziehung zwischen vollständiger Körperumrandung und sichtbarer Umrandung dar und betont den Schwerpunkt der visuellen Masse, indem unterschiedlichen Pixeln unterschiedliche Wahrscheinlichkeitswerte zugewiesen werden. Dadurch ist die Beta-Darstellung besonders gut geeignet, stark überlappende Instanzen in überfüllten Szenen zu unterscheiden, insbesondere in Verbindung mit einer neuen NMS-Strategie namens BetaNMS. Darüber hinaus wird ein neuartiger Pipeline-Ansatz, Beta R-CNN, vorgestellt, der mit BetaHead und BetaMask ausgestattet ist, um die volle Leistungsfähigkeit der Beta-Darstellung auszuschöpfen und somit eine herausragende Erkennungsleistung auch in durchsichtigen und überfüllten Szenen zu erzielen.

Beta R-CNN: Ein Blick auf die Fußgängerdetektion aus einer anderen Perspektive | Neueste Forschungsarbeiten | HyperAI