HyperAIHyperAI
il y a 17 jours

Raisonnement basé sur une chaîne hybride pour la question-réponse ouverte sur des tables et du texte

Wanjun Zhong, Junjie Huang, Qian Liu, Ming Zhou, Jiahai Wang, Jian Yin, Nan Duan
Raisonnement basé sur une chaîne hybride pour la question-réponse ouverte sur des tables et du texte
Résumé

La question-réponse tabulaire et textuelle exige que les systèmes effectuent un raisonnement sur des informations hétérogènes, en tenant compte de la structure du tableau ainsi que des liens entre le tableau et le texte. Dans cet article, nous proposons un cadre de pré-entraînement et de raisonnement centré sur les chaînes (ChAin-centric Reasoning and Pre-training, CARP). CARP utilise des chaînes hybrides pour modéliser de manière explicite le processus intermédiaire de raisonnement entre le tableau et le texte dans la réponse aux questions. Nous introduisons également une nouvelle méthode de pré-entraînement centrée sur les chaînes, visant à améliorer le modèle pré-entraîné dans la reconnaissance du processus de raisonnement transmodale et à atténuer le problème de rareté des données. Cette méthode construit un grand corpus de raisonnement en synthétisant des chemins de raisonnement hétérogènes pseudo-aléatoires à partir de Wikipedia et en générant des questions correspondantes. Nous évaluons notre système sur OTT-QA, un grand benchmark de question-réponse ouverte-domaine basé sur des tableaux et du texte, où notre approche atteint des performances de pointe. Des analyses complémentaires montrent que la chaîne hybride explicite apporte une amélioration significative des performances ainsi qu’une meilleure interprétabilité du processus de raisonnement intermédiaire, tandis que le pré-entraînement centré sur les chaînes renforce efficacement la capacité d’extraction des chaînes.

Raisonnement basé sur une chaîne hybride pour la question-réponse ouverte sur des tables et du texte | Articles de recherche récents | HyperAI