Pièce de Table : Une Approche Diviser-Pour-Régner pour la Sélection de Sous-Tableaux dans le Répondre aux Questions sur les Tableaux

L'application de modèles de langage (LMs) aux tableaux est un défi en raison des différences structurelles inhérentes entre les tableaux bidimensionnels et le texte unidimensionnel pour lequel ces modèles ont été initialement conçus. De plus, lorsqu'on applique des tableaux linéarisés aux modèles de langage, les longueurs maximales de jetons souvent imposées dans les calculs d'auto-attention rendent difficile une compréhension exhaustive du contexte réparti sur de grands tableaux. Pour relever ces défis, nous présentons PieTa (Piece of Table), un nouveau cadre pour la réponse automatique à des questions basée sur des sous-tableaux (QA). PieTa fonctionne par un processus itératif consistant à diviser les tableaux en fenêtres plus petites, à utiliser les modèles de langage pour sélectionner les cellules pertinentes au sein de chaque fenêtre, puis à fusionner ces cellules en un sous-tableau. Cette approche multi-résolution capture les dépendances entre plusieurs lignes et colonnes tout en évitant les limitations liées aux entrées de contexte longues. Instancié comme un algorithme simple d'union itérative de sous-tableaux, PieTa montre une performance améliorée par rapport aux approches précédentes basées sur des sous-tableaux pour la réponse automatique à des questions.