Voll Verkoppelte Tiefstrukturierte Netze

Neuronale Netze mit vielen Schichten, insbesondere Faltungsschichtnetze (convolutional neural networks), haben kürzlich ausgezeichnete Ergebnisse bei vielen hochkomplexen Aufgaben wie Bildklassifizierung, Objekterkennung und zuletzt auch bei semantischer Segmentierung erzielt. Insbesondere bei der semantischen Segmentierung wird häufig ein zweistufiges Verfahren angewendet. Dabei werden Faltungsnetze trainiert, um im zweiten Schritt, der traditionell ein grafisches Modell mit größerer Globalität ist, gute lokale pixelbasierte Merkmale zu liefern. In dieser Arbeit vereinen wir diesen zweistufigen Prozess in einen einzigen gemeinsamen Trainingsalgorithmus. Wir demonstrieren unsere Methode anhand der Aufgabe der semantischen Bildsegmentierung und zeigen vielversprechende Ergebnisse am anspruchsvollen PASCAL VOC 2012-Datensatz.