HyperAIHyperAI
vor einem Monat

GCNet: Nicht-lokale Netzwerke treffen auf Squeeze-Excitation Netzwerke und mehr

Yue Cao; Jiarui Xu; Stephen Lin; Fangyun Wei; Han Hu
GCNet: Nicht-lokale Netzwerke treffen auf Squeeze-Excitation Netzwerke und mehr
Abstract

Das Non-Local Netzwerk (NLNet) präsentiert einen bahnbrechenden Ansatz zur Erfassung von langreichweitigen Abhängigkeiten, indem es positionsspezifischen globalen Kontext zu jeder Abfrageposition aggregiert. Durch eine sorgfältige empirische Analyse haben wir jedoch festgestellt, dass die durch das Non-Local Netzwerk modellierten globalen Kontexte für verschiedene Abfragepositionen innerhalb eines Bildes fast identisch sind. In dieser Arbeit nutzen wir dieses Ergebnis, um ein vereinfachtes Netzwerk basierend auf einer abfrageunabhängigen Formulierung zu entwickeln, das die Genauigkeit des NLNet beibehält, aber mit erheblich weniger Berechnungen arbeitet. Wir stellen weiterhin fest, dass diese vereinfachte Architektur eine ähnliche Struktur wie das Squeeze-Excitation Netzwerk (SENet) aufweist. Daher vereinen wir sie in einem dreistufigen allgemeinen Rahmen für die Modellierung globalen Kontexts. Innerhalb dieses allgemeinen Rahmens entwerfen wir eine bessere Instanzierung, den sogenannten Global Context (GC)-Block, der leichtgewichtig ist und den globalen Kontext effektiv modellieren kann. Die Eigenschaft der Leichtgewichtigkeit ermöglicht es uns, ihn für mehrere Schichten in einem Backbone-Netzwerk anzuwenden, um ein Global Context Netzwerk (GCNet) zu konstruieren, das bei wichtigen Benchmarks für verschiedene Erkennungsaufgaben sowohl das vereinfachte NLNet als auch das SENet übertrifft. Der Code und die Konfigurationen sind unter https://github.com/xvjiarui/GCNet veröffentlicht.

GCNet: Nicht-lokale Netzwerke treffen auf Squeeze-Excitation Netzwerke und mehr | Neueste Forschungsarbeiten | HyperAI