Command Palette
Search for a command to run...
Mask R-CNN
Mask R-CNN
He Kaiming Gkioxari Georgia Dollá r Piotr Girshick Ross
Zusammenfassung
Wir präsentieren einen konzeptionell einfachen, flexiblen und allgemeingültigen Ansatz für die Objektinstanzsegmentierung. Unser Verfahren erkennt Objekte in einem Bild effizient und generiert gleichzeitig eine hochwertige Segmentierungsmaske für jede einzelne Instanz. Die Methode, Mask R-CNN genannt, erweitert Faster R-CNN um einen zusätzlichen Zweig, der parallel zum bestehenden Zweig zur Erkennung von Umrissemboundings-Boxen eine Objektmaske vorhersagt. Mask R-CNN ist einfach zu trainieren und fügt Faster R-CNN nur einen geringen Overhead hinzu, wobei die Laufzeit bei 5 fps liegt. Darüber hinaus lässt sich Mask R-CNN leicht auf andere Aufgaben übertragen, beispielsweise zur Schätzung menschlicher Körperhaltungen innerhalb desselben Rahmens. Wir erreichen Spitzenresultate in allen drei Kategorien der COCO-Challenge, nämlich Objektinstanzsegmentierung, Erkennung von Umrissemboundings-Boxen und Detektion menschlicher Schlüsselpunkte. Ohne zusätzliche Spezialeffekte übertrifft Mask R-CNN alle bisherigen Einzelmodell-Ansätze in jeder Aufgabe, einschließlich der Gewinner der COCO 2016-Challenge. Wir hoffen, dass unser einfacher und effektiver Ansatz als solide Grundlage dient und zukünftige Forschungen im Bereich der Erkennung auf Instanzebene erleichtert. Der Quellcode ist unter folgender Adresse verfügbar: https://github.com/facebookresearch/Detectron