Menschen in Kunstwerken mit CNNs erkennen

CNNs (Convolutional Neural Networks) haben die Leistungsfähigkeit bei der Objekterkennung in Fotos massiv verbessert. Die Forschung zur Objekterkennung in Kunstwerken bleibt jedoch begrenzt. In dieser Arbeit zeigen wir den aktuellen Stand der Technik anhand eines anspruchsvollen Datensatzes, People-Art, der Personen aus Fotos, Cartoons und 41 verschiedenen Kunstrichtungen enthält. Wir erreichen diese hohe Leistung durch das Feinjustieren eines CNNs für diese Aufgabe, was auch zeigt, dass das Training von CNNs auf Fotos zu einem Überanpassen an Fotos führt: nur die ersten drei oder vier Schichten können von Fotos auf Kunstwerke übertragen werden. Obwohl die Leistung des CNNs bisher die höchste ist, liegt sie unter 60 % AP (Average Precision), was darauf hinweist, dass weitere Arbeiten notwendig sind, um das Problem der Darstellungskreuzung zu lösen. Die endgültige Veröffentlichung ist über Springer unter http://dx.doi.org/10.1007/978-3-319-46604-0_57 verfügbar.