CGNet: Ein leichtgewichtiges kontextgesteuertes Netzwerk für semantische Segmentierung

Die Nachfrage nach der Anwendung von semantischen Segmentierungsmodellen auf mobilen Geräten steigt rapide. Aktuelle state-of-the-art-Netzwerke verfügen über eine enorme Anzahl von Parametern und sind daher für mobile Geräte ungeeignet, während andere Modelle mit geringem Speicherbedarf das Prinzip des Klassifikationsnetzwerks befolgen und die inhärenten Eigenschaften der semantischen Segmentierung vernachlässigen. Um dieses Problem zu lösen, schlagen wir ein neues Kontextgesteuertes Netzwerk (Context Guided Network, CGNet) vor, das ein leichtgewichtiges und effizientes Netzwerk für die semantische Segmentierung darstellt. Zunächst schlagen wir den Kontextgesteuerten (Context Guided, CG) Block vor, der sowohl lokale Merkmale als auch den umgebenden Kontext lernt und das gemeinsame Merkmal durch den globalen Kontext weiter verbessert. Auf Basis des CG-Blocks entwickeln wir das CGNet, das kontextuelle Informationen in allen Stufen des Netzwerks erfasst und speziell darauf abgestimmt ist, die Segmentierungsgenauigkeit zu erhöhen. Das CGNet wurde außerdem sorgfältig konzipiert, um die Anzahl der Parameter zu reduzieren und den Speicherbedarf zu minimieren. Bei einer vergleichbaren Anzahl von Parametern übertrifft das vorgeschlagene CGNet bestehende Segmentierungsnetzwerke erheblich. Ausführliche Experimente mit den Datensätzen Cityscapes und CamVid bestätigen die Effektivität des vorgeschlagenen Ansatzes. Insbesondere erreicht das vorgeschlagene CGNet ohne jede Nachbearbeitung oder Multiskalen-Tests einen mittleren IoU von 64,8 % auf Cityscapes bei weniger als 0,5 Mio. Parametern. Der Quellcode für das vollständige System kann unter https://github.com/wutianyiRosun/CGNet gefunden werden.