Command Palette
Search for a command to run...
A-Lamp : réseau de neurones profond convolutif multi-patch sensible à la disposition adaptative pour l’évaluation esthétique des photos
A-Lamp : réseau de neurones profond convolutif multi-patch sensible à la disposition adaptative pour l’évaluation esthétique des photos
Ma Shuang Liu Jing Chen Chang Wen
Résumé
Les réseaux de neurones convolutifs profonds (CNN) ont récemment montré des résultats prometteurs pour l’évaluation esthétique des images. Toutefois, les performances de ces méthodes basées sur des CNN profonds sont souvent compromises par la contrainte selon laquelle le réseau neuronal ne peut accepter que des entrées de taille fixe. Afin de satisfaire cette exigence, les images d’entrée doivent être transformées par découpage, déformation ou ajout de marges, ce qui altère fréquemment la composition de l’image, réduit sa résolution ou provoque des distorsions. Par conséquent, l’esthétique originale de l’image est altérée en raison de la perte potentielle de détails fins et de la structure globale de l’image. Or, ces détails fins et cette structure globale sont cruciaux pour évaluer correctement l’esthétique d’une image. Dans cet article, nous proposons une architecture innovante, appelée A-Lamp CNN (Adaptive Layout-Aware Multi-Patch Convolutional Neural Network), pour l’évaluation esthétique des photographies. Ce schéma original est capable d’accepter des images de taille arbitraire, tout en apprenant simultanément à partir de détails fins et de la disposition globale de l’image. Pour permettre l’entraînement sur ces entrées hybrides, nous avons étendu la méthode en développant une structure de réseau neuronal dédiée à deux sous-réseaux : un sous-réseau Multi-Patch et un sous-réseau Layout-Aware. Nous avons également conçu une couche d’agrégation permettant de combiner efficacement les caractéristiques hybrides issues de ces deux sous-réseaux. Des expérimentations étendues sur le benchmark à grande échelle d’évaluation esthétique (AVA) démontrent une amélioration significative des performances par rapport aux états de l’art en matière d’évaluation esthétique des photographies.