HyperAIHyperAI
vor 9 Tagen

Context-aware Block Net für die Detektion kleiner Objekte

{Mingliang Xu, Ling Shao, Luming Zhang, Bing Zhou, Zhimin Gao, Xiaoheng Jiang, Pei Lv, Lisha Cui}
Abstract

Zustandsbestimmende Objektdetektoren verwenden typischerweise eine schrittweise Downsampling-Operation des Eingabebildes, bis es durch kleine Feature-Maps repräsentiert wird. Dies führt zu einem Verlust räumlicher Information und beeinträchtigt die Darstellung kleiner Objekte. In diesem Artikel stellen wir ein kontextbewusstes Block-Netzwerk (CAB Net) vor, um die Erkennung kleiner Objekte durch die Erzeugung hochauflösender und semantisch starker Feature-Maps zu verbessern. Um die Repräsentationskapazität von Feature-Maps mit hoher räumlicher Auflösung intern zu stärken, entwerfen wir den kontextbewussten Block (CAB) mit großer Sorgfalt. CAB nutzt pyramidenförmige dilatierte Faltungen, um multilevel kontextuelle Informationen einzubeziehen, ohne die ursprüngliche Auflösung der Feature-Maps zu verlieren. Anschließend integrieren wir CAB am Ende eines abgeschnittenen Backbone-Netzwerks (z. B. VGG16) mit einem relativ geringen Downsampling-Faktor (z. B. 8) und entfernen alle nachfolgenden Schichten. Das CAB Net kann sowohl grundlegende visuelle Muster als auch semantische Informationen kleiner Objekte erfassen, wodurch die Leistung der Erkennung kleiner Objekte signifikant verbessert wird. Experimente auf den Benchmark-Datensätzen Tsinghua-Tencent 100K und Airport zeigen, dass das CAB Net andere führende Detektoren erheblich übertrifft, während es gleichzeitig Echtzeitgeschwindigkeit beibehält. Dies belegt die Effektivität des CAB Net für die Erkennung kleiner Objekte.

Context-aware Block Net für die Detektion kleiner Objekte | Neueste Forschungsarbeiten | HyperAI