Command Palette
Search for a command to run...
Semantische Segmentierung mit Instanzbewusstsein mittels mehrfacher Netzwerk-Kaskaden
Semantische Segmentierung mit Instanzbewusstsein mittels mehrfacher Netzwerk-Kaskaden
Dai Jifeng He Kaiming Sun Jian
Zusammenfassung
In der Forschung zur semantischen Segmentierung hat in letzter Zeit ein rascher Fortschritt zu verzeichnen sein, wobei jedoch viele führende Methoden nicht in der Lage sind, Objektinstanzen zu identifizieren. In diesem Beitrag stellen wir Multi-Task Network Cascades für die instanzbewusste semantische Segmentierung vor. Unser Modell besteht aus drei Netzwerken, die jeweils die Unterscheidung von Objektinstanzen, die Schätzung von Masken und die Klassifizierung von Objekten übernehmen. Diese Netzwerke bilden eine kaskadenförmige Struktur und sind darauf ausgelegt, ihre konvolutionellen Merkmale zu teilen. Wir entwickeln einen Algorithmus zur nichttrivialen end-to-end-Trainingsmethode für diese kausale, kaskadenförmige Architektur. Unser Ansatz stellt ein sauberes, einstufiges Trainingsframework dar und lässt sich auf Kaskaden mit mehr Stufen verallgemeinern. Wir erreichen eine state-of-the-art Genauigkeit bei der instanzbewussten semantischen Segmentierung auf dem PASCAL VOC-Datensatz. Gleichzeitig benötigt unsere Methode nur 360 ms zur Verarbeitung eines Bildes unter Verwendung von VGG-16 – das entspricht einer Geschwindigkeit, die zwei Größenordnungen schneller ist als frühere Systeme für dieses anspruchsvolle Problem. Als Nebenprodukt erzielt unsere Methode zudem überzeugende Ergebnisse im Objektdetektionsbereich, die die konkurrierenden Fast-/Faster R-CNN-Systeme übertreffen. Die in diesem Beitrag vorgestellte Methode bildet die Grundlage unserer Einsendung zum MS COCO 2015 Segmentierungswettbewerb, bei dem wir den ersten Platz belegten.