Répondre à des questions ouvertes à plusieurs sauts dans un domaine généralisée par ré-évaluation itérative de documents

Les approches existantes pour la réponse à des questions dans un domaine ouvert (QA) sont généralement conçues pour traiter des questions nécessitant soit un raisonnement à un seul saut (single-hop), soit un raisonnement à plusieurs sauts (multi-hop), ce qui suppose une complexité préétablie des questions à répondre. En outre, le processus itératif de récupération de documents sur plusieurs étapes entraîne souvent un nombre élevé de documents pertinents mais non pertinents pour la réponse, ce qui accentue le bruit auquel le module de lecture, sensible au bruit, est confronté en aval. Pour surmonter ces défis, nous proposons un cadre unifié pour la QA capable de répondre à des questions de tout niveau d’intrication (any-hop), qui procède itérativement à la récupération, au rérangement et au filtrage des documents, tout en déterminant de manière adaptative le moment optimal pour interrompre le processus de récupération. Pour améliorer la précision de la récupération, nous introduisons un modèle de rérangement basé sur les graphes, qui met en œuvre une interaction entre plusieurs documents comme cœur de notre cadre itératif de rérangement. Notre méthode atteint de manière cohérente des performances équivalentes ou supérieures à l’état de l’art sur des jeux de données de QA ouverte à un ou plusieurs sauts, notamment Natural Questions Open, SQuAD Open et HotpotQA.