Indices avant les réponses : Question-réponse à choix multiple améliorée par la génération

Un paradigme en vogue pour la réponse à des questions à choix multiples (MCQA) consiste à utiliser un cadre text-to-text. En uniformisant les données issues de différentes tâches dans un format unique text-to-text, ce cadre entraîne un modèle génératif encodeur-décodateur, à la fois puissant et universel. Toutefois, un effet secondaire du recours à une cible de génération pour s’adapter à la nature classificationnelle du MCQA réside dans une sous-utilisation du décodeur et des connaissances qu’il pourrait extraire. Afin d’exploiter pleinement les capacités de génération et les connaissances implicites d’un modèle pré-entraîné encodeur-décodateur, nous proposons dans cet article un modèle de MCQA amélioré par la génération, nommé GenMC. Ce modèle génère d’abord un indice à partir de la question, puis utilise cet indice pour renforcer un module lecteur dédié à la MCQA. Les expérimentations montrent que GenMC surpasser les modèles text-to-text sur plusieurs jeux de données de MCQA.