HyperAIHyperAI
vor 2 Monaten

ParseNet: Weiter blicken, um besser zu sehen

Wei Liu; Andrew Rabinovich; Alexander C. Berg
ParseNet: Weiter blicken, um besser zu sehen
Abstract

Wir stellen eine Technik vor, die globale Kontextinformationen zu tiefen Faltungsnetzen für semantische Segmentierung hinzufügt. Der Ansatz ist einfach: Die durchschnittlichen Merkmale eines Schichts werden verwendet, um die Merkmale an jedem Ort zu erweitern. Darüber hinaus untersuchen wir mehrere Besonderheiten des Trainingsprozesses, was die Leistung der Baseline-Netze (z.B. von FCN) erheblich verbessert. Wenn wir unser vorgeschlagenes globales Merkmal und eine Technik zur Lernnormalisierungsparameter hinzufügen, steigt die Genauigkeit konsistent, sogar über unsere verbesserten Versionen der Baselines hinweg. Unser vorgeschlagener Ansatz, ParseNet, erreicht den aktuellen Stand der Technik auf SiftFlow und PASCAL-Context mit geringem zusätzlichen Rechenaufwand im Vergleich zu den Baselines und nahezu den aktuellen Stand der Technik auf PASCAL VOC 2012 semantischer Segmentierung mit einem einfachen Ansatz. Der Quellcode ist unter https://github.com/weiliu89/caffe/tree/fcn verfügbar.

ParseNet: Weiter blicken, um besser zu sehen | Forschungsarbeiten | HyperAI