Rauschige Annotationen in der semantischen Segmentierung

Die Erstellung genauer Labels für die Instanzsegmentierung ist besonders herausfordernd aufgrund der komplexen Natur dieser Aufgabe. Jedes Bild erfordert mehrere Annotationen, die nicht nur die Objektklasse, sondern auch deren präzede räumliche Grenzen umfassen. Diese Anforderungen erhöhen die Wahrscheinlichkeit von Fehlern und Inkonsistenzen sowohl bei manuellen als auch bei automatischen Annotationprozessen. Durch die Simulation verschiedener Rauschbedingungen bieten wir ein realistisches Szenario zur Bewertung der Robustheit und Generalisierungsfähigkeit von Instanzsegmentierungsmodellen in verschiedenen Segmentierungsaufgaben und stellen COCO-N und Cityscapes-N vor. Wir schlagen zudem eine Benchmark für schwach annotiertes Rauschen vor, bezeichnet als COCO-WAN, die grundlegende Modelle und schwache Annotationen verwendet, um semi-automatische Annotationstools und ihre fehlerhaften Labels zu simulieren. Diese Studie beleuchtet die Qualität der durch verschiedene Modelle erzeugten Segmentierungsmasken und stellt die Effektivität beliebter Methoden in Frage, die darauf abzielen, das Lernen mit Label-Rauschen zu bewältigen.