UnifiedSKG : Unification et multitâche de l'ancrage des connaissances structurées avec les modèles de langage text-to-text

Le Structured Knowledge Grounding (SKG) utilise des connaissances structurées pour répondre aux demandes des utilisateurs, telles que l'analyse sémantique sur les bases de données et la réponse aux questions sur les bases de connaissances. Étant donné que les entrées et sorties des tâches SKG sont hétérogènes, elles ont été étudiées séparément par différentes communautés, ce qui limite une recherche systématique et compatible en SKG. Dans cet article, nous surmontons cette limitation en proposant le cadre UnifiedSKG, qui unifie 21 tâches SKG dans un format texte-à-texte, visant à promouvoir une recherche SKG systématique, plutôt qu'à être exclusivement dédié à une seule tâche, domaine ou jeu de données. Nous utilisons UnifiedSKG pour évaluer T5 dans différentes tailles et montrons que T5, avec des modifications simples si nécessaire, atteint des performances de pointe sur presque toutes les 21 tâches. Nous démontrons également que l'ajustement préfixe multi-tâches améliore les performances sur la plupart des tâches, considérablement améliorant ainsi les performances globales. UnifiedSKG facilite également l'étude de l'apprentissage sans exemple (zero-shot) et de l'apprentissage avec peu d'exemples (few-shot), et nous montrons que T0, GPT-3 et Codex peinent dans ces deux types d'apprentissage pour SKG. Nous utilisons également UnifiedSKG pour mener une série d'expériences contrôlées sur les variantes d'encodage des connaissances structurées à travers les tâches SKG. UnifiedSKG est facilement extensible à davantage de tâches et est open-source à l'adresse https://github.com/hkunlp/unifiedskg.