HyperAIHyperAI

Command Palette

Search for a command to run...

Les grands modèles de langage rencontrent Harry Potter : un jeu de données bilingue pour aligner les agents de dialogue avec les personnages

Nuo Chen†‡ Yan Wang†§ Haiyun Jiang† Deng Cai† Yuhan Li† Ziyang Chen† Longyue Wang† Jia Li†§

Résumé

Ces dernières années, les grands modèles de langage conversationnels (LLMs) tels que ChatGPT et GPT-4 ont démontré un potentiel considérable dans la construction d'agents de dialogue à domaine ouvert. Cependant, l'alignement de ces agents avec des personnages spécifiques ou des individus reste un défi majeur en raison des complexités de la représentation des personnages et du manque d'annotations exhaustives. Dans cet article, nous présentons le jeu de données Harry Potter Dialogue (HPD), conçu pour faire progresser l'étude des agents de dialogue et de l'alignement des personnages. Ce jeu de données couvre toutes les séances de dialogue (en anglais et en chinois) de la série Harry Potter et est annoté avec des informations contextuelles essentielles, notamment les scènes de dialogue, les locuteurs, les relations entre les personnages et leurs attributs. Ces annotations exhaustives peuvent permettre aux LLMs d'accéder à des capacités conversationnelles guidées par les personnages. De plus, il peut servir de référence universelle pour évaluer la capacité d'un LLM à s'aligner sur un personnage spécifique. Nous évaluons les LLMs sur HPD dans des configurations d'apprentissage par fine-tuning et d'apprentissage en contexte. Les résultats montrent qu'il existe encore un grand potentiel d'amélioration pour générer des réponses de haute qualité et alignées sur les personnages, mais que le jeu de données proposé est précieux pour orienter les modèles vers des réponses qui s'alignent mieux sur le personnage de Harry Potter.


Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp
Les grands modèles de langage rencontrent Harry Potter : un jeu de données bilingue pour aligner les agents de dialogue avec les personnages | Articles | HyperAI