HyperAIHyperAI

Command Palette

Search for a command to run...

Représentation et révision : Modélisation des intrigues pour la narration visuelle

Chi-Yang Hsu Yun-Wei Chu Ting-Hao &#39 Kenneth&#39 Huang Lun-Wei Ku

Résumé

Rédiger une histoire cohérente et captivante n’est pas une tâche aisée. Les écrivains créatifs s’appuient sur leurs connaissances et leur vision du monde pour rassembler des éléments disparates en une trame narrative fluide, en travaillant et en retravaillant de manière itérative jusqu’à l’aboutissement d’une version optimale. Les modèles automatisés de narration visuelle (VIST), en revanche, exploitent mal les connaissances externes et le processus itératif lorsqu’ils tentent de générer des récits. Ce papier présente PR-VIST, un cadre qui représente une séquence d’images d’entrée sous forme de graphe narratif, dans lequel il identifie le meilleur chemin menant à la construction d’une histoire. PR-VIST exploite ensuite ce chemin pour apprendre à générer le récit final via un processus d’entraînement itératif. Ce cadre produit des récits supérieurs en termes de diversité, de cohérence et de naturel, selon à la fois des évaluations automatiques et humaines. Une étude d’ablation démontre que tant la structuration de l’intrigue que le retraitement itératif contribuent significativement à la supériorité du modèle.


Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp