Automatische Erkennung von Kunststilen in Gemälden mit tiefen Lernverfahren

Der künstlerische Stil (oder künstlerische Bewegung) eines Gemäldes ist ein reichhaltiger Beschreibungsparameter, der sowohl visuelle als auch historische Informationen über das Werk erfasst. Die korrekte Identifizierung des künstlerischen Stils ist entscheidend für die Katalogisierung großer künstlerischer Datenbanken. In diesem Artikel untersuchen wir den Einsatz tiefer residueller neuronaler Netze zur Lösung des Problems der Erkennung künstlerischer Stile und erreichen auf dem Wikipaintings-Datensatz (für 25 verschiedene Stile) eine Leistungssteigerung gegenüber bestehenden Ansätzen um fast 10 %. Um dieses Ergebnis zu erzielen, wird das Netzwerk zunächst auf ImageNet vortrainiert und anschließend tiefgreifend für die Aufgabe des künstlerischen Stils retrainiert. Wir evaluieren empirisch, dass zur Erzielung der besten Leistung etwa 20 Schichten retrainiert werden müssen. Dies deutet darauf hin, dass die beiden Aufgaben wie erwartet ähnlich sind und erklärt den vorherigen Erfolg handgezeichneter Merkmale. Zudem zeigen wir, dass die auf dem Wikipaintings-Datensatz erkannten Stile mit jenen auf einem unabhängigen Datensatz konsistent sind, und beschreiben eine Reihe von Experimenten, die wir durchgeführt haben, um diesen Ansatz sowohl qualitativ als auch quantitativ zu validieren.