Dites-moi pourquoi : Utiliser la réponse à des questions comme supervision à distance pour la justification des réponses

Pour de nombreuses applications de réponse à des questions (QA), la capacité à expliquer pourquoi un modèle donné a choisi une réponse précise est essentielle. Toutefois, le manque de données étiquetées pour les justifications des réponses rend l’apprentissage de cette capacité difficile et coûteux. Dans cet article, nous proposons une approche qui utilise le classement des réponses comme supervision à distance pour apprendre à sélectionner des justifications informatives, lesquelles servent de liens inférentiels entre la question et la réponse correcte, tout en contenant souvent peu de chevauchement lexical avec l’une ou l’autre. Nous introduisons une architecture de réseau neuronal pour la QA qui réordonne les justifications des réponses comme une étape intermédiaire (et interprétable par l’humain) dans le processus de sélection de la réponse. Notre méthode s’appuie sur un ensemble de caractéristiques conçues pour combiner des représentations apprises et des caractéristiques explicites, afin de capturer efficacement les liens entre les questions, les réponses et leurs justifications. Nous démontrons que, grâce à cette approche end-to-end, nous améliorons significativement une base forte de recherche d’information (IR) en termes de classement des justifications (+9 % de justifications jugées très pertinentes) et de sélection de réponse (+6 % de précision à 1, P@1).