SOLOv2: Dynamische und schnelle Instanzsegmentierung

In dieser Arbeit zielen wir darauf ab, ein einfaches, direktes und schnelles Instanzsegmentierungsframework mit hoher Leistung zu entwickeln. Wir befolgen das Prinzip der SOLO-Methode von Wang et al. "SOLO: Objekte nach Orten segmentieren". Wichtig ist, dass wir einen Schritt weiter gehen, indem wir den Maskenkopf des Objektsegmentierers dynamisch lernen, sodass dieser auf den Ort konditioniert ist. Insbesondere wird die Maskenverzweigung in eine Maskenkernverzweigung und eine Maskenfeatureverzweigung getrennt, die jeweils für das Lernen des Faltungskerns und der gefalteten Features verantwortlich sind. Darüber hinaus schlagen wir Matrix NMS (Non Maximum Suppression) vor, um die zusätzliche Inferenzzeit durch die NMS der Masken erheblich zu reduzieren. Unser Matrix NMS führt NMS in einem Schritt mit parallelen Matrixoperationen durch und liefert bessere Ergebnisse. Wir präsentieren ein einfaches direktes Instanzsegmentierungssystem, das mehrere Stand-of-the-Art-Methoden sowohl in Bezug auf Geschwindigkeit als auch auf Genauigkeit übertrifft. Eine leichte Version von SOLOv2 arbeitet bei 31,3 FPS und erreicht 37,1 % AP. Zudem zeigen unsere Spitzenergebnisse in der Objekterkennung (aus unserem Nebenprodukt der Maske) und der panoptischen Segmentierung das Potenzial, als neuer starker Baseline für viele instanzbasierte Erkennungsaufgaben neben der Instanzsegmentierung zu dienen. Der Quellcode ist unter folgender Adresse verfügbar: https://git.io/AdelaiDet