HyperAIHyperAI
il y a 11 jours

TVStoryGen : Un jeu de données pour la génération d’histoires à partir de descriptions de personnages

Mingda Chen, Kevin Gimpel
TVStoryGen : Un jeu de données pour la génération d’histoires à partir de descriptions de personnages
Résumé

Nous introduisons TVStoryGen, un jeu de données dédié à la génération de récits, qui consiste à produire des résumés détaillés d’épisodes de séries télévisées à partir d’un résumé succinct et d’un ensemble de documents décrivant les personnages impliqués. Contrairement aux autres jeux de données de génération narrative, TVStoryGen contient des récits rédigés par des scénaristes professionnels et met en scène des interactions complexes entre plusieurs personnages. La génération de récits dans TVStoryGen exige de tirer des informations pertinentes à partir de documents longs décrivant les personnages, en s’appuyant sur le résumé succinct fourni. En outre, nous proposons d’entraîner des modèles inverses sur notre jeu de données afin d’évaluer la fidélité des récits générés. TVStoryGen a été construit à partir de sites web contribués par des fans, ce qui nous a permis de collecter 26 000 résumés d’épisodes, avec une longueur moyenne de 1 868,7 tokens. Expérimentalement, nous adoptons une approche hiérarchique de génération narrative et constatons que le modèle neuronal utilisant des sélecteurs de contenu optimaux pour les descriptions des personnages obtient les meilleurs résultats sur les métriques automatiques, démontrant ainsi le potentiel de notre jeu de données pour stimuler des recherches futures sur la génération narrative sous contraintes. Une analyse qualitative révèle que le modèle performant parvient parfois à générer du contenu non fidèle au résumé court, ouvrant ainsi des perspectives prometteuses pour les travaux futurs.

TVStoryGen : Un jeu de données pour la génération d’histoires à partir de descriptions de personnages | Articles de recherche récents | HyperAI