Ensemble De Données De Dialogue De Jeu De Rôle ChatHaruhi-RolePlaying
Date
Taille
Tags

* Cet ensemble de données prend en charge l'utilisation en ligne.Cliquez ici pour sauter.
ChatHaruhi est un ensemble de données contenant 32 personnages de télévision/anime chinois/anglais et plus de 54 000 dialogues simulés.
Les chatbots de jeu de rôle construits avec de grands modèles de langage ont attiré une attention généralisée, mais des techniques plus avancées sont nécessaires pour imiter des personnages fictifs spécifiques. Les chercheurs ont proposé un algorithme qui contrôle le modèle de langage grâce à des invites améliorées et à la mémoire des caractères extraits du script. En collectant des corpus de films, de romans et de scénarios et en effectuant une extraction structurée, les chercheurs ont collecté plus de 23 000 messages de conversation. Ces données de conversation peuvent être utilisées pour former et tester des modèles de langage de jeu de rôle. Parallèlement, en utilisant l’algorithme proposé par les chercheurs et avec l’aide de GPT3 et GPT4, les chercheurs ont généré plus de 27 000 dialogues supplémentaires pour ces personnages.