Ortsbewusstes Upsampling für die semantische Segmentierung

Viele erfolgreiche Lernziele, wie die Minimierung der Dice-Verlustfunktion und der Kreuzentropie-Verlustfunktion, haben maßgebliche Fortschritte bei Segmentierungsaufgaben ermöglicht. Neben diesen semantischen Metriken zielt diese Arbeit darauf ab, Ortsinformationen in die semantische Segmentierung einzuführen. Ausgehend von diesem Ansatz präsentieren wir ein location-aware Upsampling (LaU), das die Interpolationskoordinaten adaptiv mit lernbaren Verschiebungen verfeinert. Anschließend werden location-aware Verlustfunktionen definiert, indem Pixel angeregt werden, sich zu gut klassifizierten Positionen zu bewegen. Das LaU-Modul kombiniert die Vorhersage von Verschiebungen mit der Interpolation und wird end-to-end trainiert, um an jeder Position eine Zuverlässigkeitsbewertung von grob bis fein zu generieren. Unter Anleitung der location-aware Verlustfunktionen kann das neue Modul seine einfache Alternative (z. B. bilineare Interpolation) plug-and-play ersetzen und damit die führenden Encoder-Decoder-Ansätze weiter verbessern. Umfassende Experimente bestätigen eine konsistente Steigerung gegenüber den aktuellen State-of-the-Art-Methoden auf Benchmark-Datensätzen. Unser Code ist unter https://github.com/HolmesShuan/Location-aware-Upsampling-for-Semantic-Segmentation verfügbar.