Command Palette
Search for a command to run...
ICNet für die Echtzeit-Semantische Segmentierung von Bildern hoher Auflösung
ICNet für die Echtzeit-Semantische Segmentierung von Bildern hoher Auflösung
Zhao Hengshuang Qi Xiaojuan Shen Xiaoyong Shi Jianping Jia Jiaya
Zusammenfassung
In diesem Beitrag konzentrieren wir uns auf die anspruchsvolle Aufgabe der Echtzeit-Semantiksegmentierung. Sie findet zahlreiche praktische Anwendungen, birgt jedoch grundlegende Schwierigkeiten bei der Reduktion eines erheblichen Teils der Berechnungen für die pixelweise Label-Vorhersage. Wir stellen ein Bild-Kaskaden-Netzwerk (ICNet) vor, das mehrere Auflösungsstufen unter geeigneter Label-Führung integriert, um diese Herausforderung zu bewältigen. Wir führen eine detaillierte Analyse unseres Frameworks durch und stellen die Kaskaden-Feature-Fusion-Einheit vor, die eine schnelle Erzielung hochwertiger Segmentierung ermöglicht. Unser System erreicht Echtzeit-Inferenz auf einer einzigen GPU mit ansprechenden Ergebnissen, die an anspruchsvollen Datensätzen wie Cityscapes, CamVid und COCO-Stuff evaluiert wurden.