UnifiedQA : Dépasser les limites des formats avec un seul système de Q&A

Les tâches de réponse à des questions (QA) ont été formulées selon divers formats, tels que la sélection d'intervalles extraits, le choix multiple, etc. Cela a conduit au développement de modèles spécialisés par format et même à une division implicite au sein de la communauté QA. Nous soutenons que ces frontières sont artificielles et peut-être inutiles, étant donné que les capacités de raisonnement que nous cherchons à enseigner ne sont pas dictées par le format. Pour preuve, nous utilisons les derniers progrès en modélisation linguistique pour construire un seul modèle QA pré-entraîné, UnifiedQA, qui performe de manière surprenante sur 17 jeux de données QA couvrant 4 formats variés. UnifiedQA offre des performances comparables à celles de 9 modèles différents entraînés sur des jeux de données individuels. Même confronté à 12 jeux de données non vus mais aux formats observés, UnifiedQA performe remarquablement bien, démontrant une forte généralisation à partir de ses données d'entraînement hors format. Enfin, l'affinage simple de ce modèle QA pré-entraîné en modèles spécialisés aboutit à un nouveau niveau d'excellence sur 6 jeux de données, établissant ainsi UnifiedQA comme un point de départ solide pour la construction de systèmes QA.