EfficientSeg: Ein effizienter semantischer Segmentierungsnetzwerk

Das Training tiefer neuronalen Netze ohne vortrainierte Gewichte und mit geringen Datenmengen erweist sich als anspruchsvoll und erfordert häufig mehr Trainingsiterationen. Es ist zudem bekannt, dass tiefere Modelle bei der semantischen Segmentierung gegenüber flacheren Architekturen überlegen sind. Daher stellen wir die EfficientSeg-Architektur vor, eine modifizierte und skalierbare Variante des U-Net, die trotz ihrer Tiefe effizient trainiert werden kann. Wir haben die EfficientSeg-Architektur am Minicity-Datensatz evaluiert und erreichten mit derselben Anzahl an Parametern (51,5 % mIoU) eine deutlich bessere Leistung als die U-Net-Benchmark-Performance (40 % mIoU). Das erfolgreichste Modell erzielte eine mIoU-Score von 58,1 % und belegte damit den vierten Platz im semantischen Segmentierungs-Track der ECCV 2020 VIPriors-Challenge.