Schwach überwachte tiefe Detektionsnetze

Das schwach überwachte Lernen von Objekterkennung ist ein wichtiges Problem im Bereich der Bildverarbeitung, das bisher noch keine zufriedenstellende Lösung gefunden hat. In dieser Arbeit adressieren wir dieses Problem durch die Nutzung der Leistungsfähigkeit tiefer konvolutiver Neuronaler Netze, die auf umfangreichen Bildklassifizierungsaufgaben vortrainiert wurden. Wir schlagen eine schwach überwachte tief lernende Detektionsarchitektur vor, die eines dieser Netzwerke modifiziert, um auf der Ebene von Bildabschnitten zu arbeiten und gleichzeitig Abschnittsauswahl und Klassifizierung durchzuführen. Als Bildklassifizierer trainiert, lernt die Architektur implizit Objektdetektoren, die besser sind als alternative schwach überwachte Detektionssysteme auf den PASCAL VOC-Daten. Das Modell, eine einfache und elegante End-to-End-Architektur, übertrifft auch Standardtechniken zur Datenverstärkung und Feinabstimmung für die Aufgabe der Bildklassifizierung.