FREDOM: Fairness Domain Adaptation Ansatz für die semantische Szenenverstehens

Obwohl die Domain-Adaptation bei der semantischen Szenensegmentierung in den letzten Jahren beeindruckende Fortschritte erzielt hat, sind die Fragen der Fairness in der Domain-Adaptation bisher noch nicht ausreichend definiert oder adressiert worden. Zudem stellt Fairness eine der entscheidenden Aspekte dar, wenn Segmentierungsmodelle in menschenbezogene Anwendungen der realen Welt, beispielsweise im Bereich des autonomen Fahrens, eingeführt werden, da ungerechtfertigte Vorhersagen die menschliche Sicherheit beeinträchtigen können. In diesem Artikel präsentieren wir einen neuartigen Ansatz zur Fairness-orientierten Domain-Adaptation (FREDOM) für die semantische Szenensegmentierung. Insbesondere leitet sich aus der vorgeschlagenen Formulierung eines Fairness-Ziels ein neuer Adaptationsrahmen ab, der auf einer fairen Behandlung der Klassenausprägungen basiert. Darüber hinaus wird ein neuer bedingter struktureller Constraint eingeführt, um die Strukturabhängigkeit im Kontext allgemein zu modellieren und die Konsistenz der vorhergesagten Segmentierung zu gewährleisten. Durch die vorgeschlagene Conditional Structure Network wird die Selbst-Attention-Mechanismen ausreichend genutzt, um die strukturellen Informationen der Segmentierung präzise zu erfassen. Die Ablationsstudien zeigen, dass der vorgeschlagene Ansatz sowohl die Leistung der Segmentierungsmodelle verbessert als auch die Fairness der Modellvorhersagen fördert. Die experimentellen Ergebnisse auf zwei etablierten Benchmarks – nämlich SYNTHIA $\to$ Cityscapes und GTA5 $\to$ Cityscapes – belegen, dass unsere Methode eine State-of-the-Art (SOTA)-Leistung erreicht.