Bewertung von Bayesschen Tiefenlernmethoden für die semantische Segmentierung

Tiefes Lernen hat die Computer Vision und insbesondere die semantische Segmentierung revolutioniert. Dabei wird Bayessches Tiefes Lernen (Bayesian Deep Learning, BDL) verwendet, um Unsicherheitskarten aus tiefen Modellen zu gewinnen, wenn diese semantische Klassen vorhersagen. Diese Informationen sind bei der Verwendung der semantischen Segmentierung für autonomes Fahren von entscheidender Bedeutung. Standard-semantische Segmentierungssysteme verfügen über etablierte Bewertungsmaßstäbe. Allerdings erfordert die wachsende Beliebtheit des BDL in der Computer Vision neue Maßstäbe, um zu bewerten, ob eine BDL-Methode bessere Unsicherheitsschätzungen als eine andere Methode liefert. In dieser Arbeit schlagen wir drei solche Maßstäbe vor, um BDL-Modelle speziell für die Aufgabe der semantischen Segmentierung zu evaluieren. Wir modifizieren DeepLab-v3+, eines der fortschrittlichsten tiefen neuronalen Netze, und erstellen dessen bayessches Pendant unter Verwendung von MC Dropout und Concrete Dropout als Inferenztechniken. Anschließend vergleichen und testen wir diese beiden Inferenztechniken auf dem bekannten Cityscapes-Datensatz mit Hilfe unserer vorgeschlagenen Maßstäbe. Unsere Ergebnisse bieten neuen Vergleichsstandards für Forscher, um ihre verbesserte Quantifizierung von Unsicherheiten zu bewerten und sicherere semantische Segmentierungen anzustreben.