U-Net : Compréhension de la lecture machine avec des questions sans réponse

La compréhension de la lecture par machine avec des questions sans réponse est une nouvelle tâche complexe pour le traitement du langage naturel. Une sous-tâche clé consiste à prédire de manière fiable si une question est sans réponse. Dans cet article, nous proposons un modèle unifié appelé U-Net, composé de trois éléments importants : pointeur de réponse, pointeur d'absence de réponse et vérificateur de réponse. Nous introduisons un nœud universel, ce qui permet de traiter la question et son passage contextuel comme une seule séquence continue de jetons (tokens). Le nœud universel encode les informations fusionnées provenant à la fois de la question et du passage, jouant ainsi un rôle crucial dans la prédiction de l'answerabilité des questions et améliorant considérablement la concision du U-Net. Contrairement aux modèles en pipeline d'avant-garde, U-Net peut être appris selon une approche bout à bout (end-to-end). Les résultats expérimentaux sur le jeu de données SQuAD 2.0 montrent que U-Net peut prédire efficacement l'impossibilité de répondre aux questions et atteint un score F1 de 71,7 sur SQuAD 2.0.