il y a 2 mois
Un Transformateur Impartial pour la Visualisation de Récits
Nikolaos Tsakas; Maria Lymperaiou; Giorgos Filandrianos; Giorgos Stamou

Résumé
La visualisation narrative est une tâche avancée de la vision par ordinateur visant la synthèse d'images séquentielles, où les échantillons générés doivent être réalistes, fidèles à leurs conditions et cohérents dans leur séquence. Notre travail propose une nouvelle approche architecturale et de formation : le Transformers Impartial (Impartial Transformer) réalise des scènes plausibles et pertinentes au texte, ainsi qu'une cohérence séquentielle en utilisant le moins de paramètres entraînables possible. Cette amélioration est même capable de gérer la synthèse d'échantillons « difficiles » comportant des objets occultés, obtenant des métriques d'évaluation améliorées par rapport aux approches précédentes.