FishSegSSL: Ein semi-supervised semantischer Segmentierungsframework für Fischaugenbilder
Die Anwendung von Großfeldkameras mit Fischaugenobjektiven bietet erhebliche Vorteile für verschiedene Anwendungen im Bereich des Computer Vision in der Praxis, darunter das autonome Fahren. Während tiefe Lernverfahren bei herkömmlichen Computer-Vision-Anwendungen mit regulären perspektivischen Bildern bereits erfolgreich eingesetzt wurden, bleibt ihr Potenzial im Kontext von Fischaugenbildern weitgehend unerforscht, da entsprechende Datensätze für vollständig überwachtes Lernen begrenzt sind. Semi-supervised Learning stellt hier eine vielversprechende Lösung dar. In dieser Studie untersuchen und benchmarken wir zwei etablierte semi-supervised Ansätze aus dem Bereich der perspektivischen Bilder für die Segmentierung von Fischaugenbildern. Darüber hinaus stellen wir FishSegSSL vor, einen neuartigen Rahmen für die Segmentierung von Fischaugenbildern mit drei semi-supervised Komponenten: Pseudolabel-Filterung, dynamischer Konfidenzschwellenwert und robuste starke Augmentierung. Die Evaluation am WoodScape-Datensatz, der aus Fahrzeugmontierten Fischaugenkameras stammt, zeigt, dass unsere vorgeschlagene Methode die Leistung des Modells im Vergleich zu vollständig überwachten Methoden – bei gleichem Umfang an gelabelten Daten – um bis zu 10,49 % steigert. Zudem verbessert unsere Methode bestehende Bildsegmentierungsansätze um 2,34 %. Sofern wir uns richtig informiert haben, handelt es sich hierbei um die erste Arbeit zur semi-supervised semantischen Segmentierung von Fischaugenbildern. Zusätzlich führen wir eine umfassende Ablationsstudie und Sensitivitätsanalyse durch, um die Wirksamkeit jeder vorgeschlagenen Methode in dieser Forschung zu untermauern.