RelationPrompt : Exploiter les prompts pour générer des données synthétiques pour l'extraction de triplets relationnels en zero-shot

Bien que l'extraction de relations soit cruciale pour la construction et la représentation des connaissances, moins de recherches sont consacrées à la généralisation à des types de relations inconnus. Nous introduisons le cadre de tâche d'Extraction de Triplets de Relations à Vue Zéro (ZeroRTE) afin d'encourager davantage de recherches sur les méthodes d'extraction de relations à faibles ressources. Étant donné une phrase en entrée, chaque triplet extrait est composé d'une entité principale, d'une étiquette de relation et d'une entité secondaire, où l'étiquette de relation n'a pas été vue lors de l'entraînement. Pour résoudre ZeroRTE, nous proposons de synthétiser des exemples de relations en sollicitant des modèles linguistiques pour générer des textes structurés. Plus précisément, nous unifions les invitations aux modèles linguistiques et les approches par textes structurés pour concevoir un modèle d'invitation structuré permettant la génération d'échantillons relationnels synthétiques conditionnés aux invitations par étiquettes de relation (RelationPrompt). Afin de surmonter la limitation liée à l'extraction de plusieurs triplets relationnels dans une phrase, nous avons conçu une nouvelle méthode de décodage par recherche de triplets. Les expériences menées sur les jeux de données FewRel et Wiki-ZSL montrent l'efficacité du RelationPrompt pour la tâche ZeroRTE et la classification relationnelle à vue zéro. Notre code et nos données sont disponibles sur github.com/declare-lab/RelationPrompt.