EL-GAN: Embedding Loss-getriebene Generative Adversarial Networks für die Spurerkennung

Faltungsschichtneuronale Netze wurden erfolgreich auf Probleme der semantischen Segmentierung angewendet. Es gibt jedoch viele Probleme, die inhärent keine Pixelweise Klassifikationsprobleme sind, aber dennoch häufig als semantische Segmentierung formuliert werden. Diese fehlerhafte Formulierung erfordert anschließend manuell gestaltete, situationsbezogene und rechenintensive Nachbearbeitungsmethoden, um die pro Pixel berechneten Wahrscheinlichkeitskarten in die gewünschten Endausgaben zu konvertieren. Generative adversarische Netzwerke (GANs) können verwendet werden, um die Ausgabe des semantischen Segmentierungsnetzes realistischer oder strukturhaltiger zu gestalten, was die Abhängigkeit von potenziell komplexen Nachbearbeitungen verringert. In dieser Arbeit schlagen wir EL-GAN vor: ein GAN-Framework zur Milderung des diskutierten Problems durch Verwendung eines Einbettungsverlustes (embedding loss). Mit EL-GAN unterscheiden wir gleichzeitig auf der Grundlage gelernter Einbettungen sowohl der Labels als auch der Vorhersage. Dies führt zu stabilerem Training aufgrund besserer diskriminativer Informationen und nutzt von der simultanen Betrachtung von 'falschen' und 'echten' Vorhersagen. Dies stabilisiert den adversären Trainingsprozess erheblich. Wir nutzen die TuSimple-Liniemarkierungsausforderung, um zu zeigen, dass es mit unserem vorgeschlagenen Framework möglich ist, die inhärenten Anomalien der Formulierung als semantische Segmentierung zu überwinden. Die Ausgabe ist nicht nur bei Vergleich mit herkömmlichen Methoden erheblich den Labels ähnlicher, sondern das nachfolgende Postprocessing ist auch einfacher und überschreitet die wettbewerbsfähige Genauigkeitsschwelle von 96 %.