U-Net: Faltungssnetze für die Segmentierung von biomedizinischen Bildern

Es besteht weitgehende Einigkeit darüber, dass die erfolgreiche Ausbildung von tiefen Netzen viele Tausend annotierte Trainingsbeispiele erfordert. In dieser Arbeit stellen wir ein Netzwerk und eine Trainingsstrategie vor, die auf der intensiven Verwendung von Datenverstärkung (data augmentation) basieren, um die verfügbaren annotierten Beispiele effizienter zu nutzen. Die Architektur besteht aus einem zusammenziehenden Pfad zur Erfassung des Kontexts und einem symmetrischen erweiternden Pfad, der eine präzise Lokalisierung ermöglicht. Wir zeigen, dass ein solches Netzwerk von sehr wenigen Bildern aus end-to-end trainiert werden kann und die bisher beste Methode (ein sliding-window Faltungsnetz) bei der ISBI-Herausforderung zur Segmentierung neuronaler Strukturen in elektronenmikroskopischen Stapeln übertrifft. Mit demselben Netzwerk, das auf transmittierter Lichtmikroskopiebilder (Phasenkontrast- und DIC-Bilder) trainiert wurde, gewannen wir die ISBI-Zellverfolgungsherausforderung 2015 in diesen Kategorien mit großem Vorsprung. Darüber hinaus ist das Netzwerk schnell. Die Segmentierung eines 512x512-Bildes dauert auf einer aktuellen GPU weniger als eine Sekunde. Die vollständige Implementierung (auf Basis von Caffe) und die trainierten Netzwerke sind unter http://lmb.informatik.uni-freiburg.de/people/ronneber/u-net verfügbar.