HyperAIHyperAI
il y a 2 mois

InstructUIE : Ajustement multi-tâches pour l'extraction unifiée d'informations

Xiao Wang; Weikang Zhou; Can Zu; Han Xia; Tianze Chen; Yuansen Zhang; Rui Zheng; Junjie Ye; Qi Zhang; Tao Gui; Jihua Kang; Jingsheng Yang; Siyuan Li; Chunsai Du
InstructUIE : Ajustement multi-tâches pour l'extraction unifiée d'informations
Résumé

Les grands modèles de langage ont débloqué des capacités multitâches puissantes grâce à la lecture de prompts instructifs. Cependant, des études récentes ont montré que les modèles existants rencontrent encore des difficultés dans les tâches d'extraction d'information. Par exemple, le modèle gpt-3.5-turbo a obtenu un score F1 de 18,22 sur l'ensemble de données Ontonotes, ce qui est nettement inférieur aux performances de pointe actuelles. Dans cet article, nous proposons InstructUIE, un cadre d'extraction d'information unifié basé sur l'ajustement des instructions (instruction tuning), capable de modéliser uniformément diverses tâches d'extraction d'information et de capturer les dépendances inter-tâches. Pour valider notre méthode proposée, nous introduisons IE INSTRUCTIONS, une référence comprenant 32 ensembles de données variés d'extraction d'information au format texte-texte unifié avec des instructions rédigées par des experts. Les résultats expérimentaux montrent que notre méthode atteint des performances comparables à celles de BERT dans les configurations supervisées et dépasse considérablement l'état de l'art ainsi que gpt-3.5 dans les configurations zero-shot.

InstructUIE : Ajustement multi-tâches pour l'extraction unifiée d'informations | Articles de recherche récents | HyperAI