Ein Buch nach seinem Cover beurteilen

Buchumschläge vermitteln Informationen an potenzielle Leser, aber können Computer diese gleichen Informationen ebenfalls erlernen? Wir schlagen vor, ein tiefes Faltungsneuronales Netzwerk (Convolutional Neural Network, CNN) zu verwenden, um den Genre eines Buches auf Basis der visuellen Hinweise seines Umschlages vorherzusagen. Das Ziel dieser Forschung ist es, zu untersuchen, ob Beziehungen zwischen Büchern und ihren Umschlägen gelernt werden können. Die Bestimmung des Genres eines Buches ist jedoch eine schwierige Aufgabe, da Umschläge ambig sein können und Genres weit gefasst sein. Trotzdem zeigen wir, dass ein CNN Merkmale extrahieren und die zugrunde liegenden Designregeln identifizieren kann, die vom Designer zur Definition eines Genres gesetzt wurden. Durch den Einsatz maschinellen Lernens können wir die großen Ressourcen, die verfügbar sind, in den Prozess der Buchumschlaggestaltung integrieren. Darüber hinaus präsentieren wir einen neuen anspruchsvollen Datensatz, der für viele Mustererkennungsaufgaben verwendet werden kann.