HyperAIHyperAI
vor 11 Tagen

TVStoryGen: Ein Datensatz zum Generieren von Geschichten mit Charakterbeschreibungen

Mingda Chen, Kevin Gimpel
TVStoryGen: Ein Datensatz zum Generieren von Geschichten mit Charakterbeschreibungen
Abstract

Wir stellen TVStoryGen vor, einen Datensatz zum Geschichtenerzählen, der die Erstellung detaillierter Zusammenfassungen von Fernsehserienfolgen aus einer kurzen Zusammenfassung und einer Reihe von Dokumenten über die beteiligten Charaktere erfordert. Im Gegensatz zu anderen Datensätzen zum Geschichtenerzählen enthält TVStoryGen Geschichten, die von professionellen Drehbuchautoren verfasst wurden und komplexe Interaktionen zwischen mehreren Charakteren aufweisen. Die Generierung von Geschichten im Rahmen von TVStoryGen erfordert, relevante Informationen aus den umfangreichen Dokumenten zu den Charakteren basierend auf der kurzen Zusammenfassung zu extrahieren. Darüber hinaus schlagen wir vor, umgekehrte Modelle auf unserem Datensatz zu trainieren, um die Treue der generierten Geschichten zu bewerten. TVStoryGen wurde aus von Fans beigesteuerten Webseiten zusammengestellt, wodurch wir 26.000 Folienzusammenfassungen mit durchschnittlich 1868,7 Tokens sammeln konnten. Empirisch verfolgen wir einen hierarchischen Ansatz zum Geschichtenerzählen und stellen fest, dass das neuronale Modell, das Oracle-Inhaltsauswahler für Charakterbeschreibungen nutzt, die beste Leistung in Bezug auf automatisierte Metriken erzielt, was das Potenzial unseres Datensatzes zur Inspiration zukünftiger Forschung im Bereich des geschichtenerzeugenden Modells mit Einschränkungen unterstreicht. Eine qualitative Analyse zeigt, dass das bestperformende Modell gelegentlich Inhalte generiert, die der kurzen Zusammenfassung nicht treu sind, was vielversprechende Ansatzpunkte für zukünftige Arbeiten darstellt.

TVStoryGen: Ein Datensatz zum Generieren von Geschichten mit Charakterbeschreibungen | Neueste Forschungsarbeiten | HyperAI