Réponse fidèle aux questions temporelles sur des sources hétérogènes

La réponse à des questions temporelles (QA) implique des contraintes temporelles, avec des expressions telles que « ... en 2019 » ou « ... avant la pandémie de COVID ». Dans le premier cas, le temps est une condition explicite ; dans le second, il est implicite. Les méthodes actuelles de pointe présentent des limites sur trois dimensions. Premièrement, grâce à l’inférence neuronale, les contraintes temporelles sont simplement ajustées de manière souple, laissant place à des réponses invalides ou inexplicables. Deuxièmement, les questions comportant des contraintes temporelles implicites sont mal prises en charge. Troisièmement, les réponses proviennent d’une seule source : soit une base de connaissances (KB), soit un corpus de texte. Nous proposons un système de réponse à questions temporelles qui surmonte ces lacunes. Premièrement, il impose rigoureusement les contraintes temporelles pour assurer des réponses fidèles fondées sur des preuves concrètes. Deuxièmement, il traite correctement les questions implicites. Troisièmement, il opère sur des sources hétérogènes, intégrant de manière unifiée les bases de connaissances, les textes et les tables du web. Notre méthode repose sur trois étapes : (i) comprendre la question et ses conditions temporelles, (ii) extraire des preuves à partir de toutes les sources, et (iii) fournir une réponse fidèle. Étant donné que les questions implicites sont rares dans les benchmarks existants, nous introduisons une méthode rigoureuse pour générer des questions diversifiées. Les expérimentations montrent une performance supérieure par rapport à une série de méthodes de référence.