Schlussfolgern über Hybrid Chains für Tabellen- und Text-Offene-Domänen-Fragebeantwortung

Tabellen- und Textfragenbeantwortung erfordert Systeme, die über heterogene Informationen hinweg reasoning durchführen müssen, wobei die Tabellenstruktur sowie die Beziehungen zwischen Tabelle und Text berücksichtigt werden. In diesem Paper stellen wir einen chAin-zentrierten Reasoning- und Pre-training-Framework (CARP) vor. CARP nutzt hybride Ketten, um den expliziten, zwischen Tabellen und Text verlaufenden Schlussfolgerungsprozess für die Fragenbeantwortung zu modellieren. Außerdem schlagen wir eine neuartige, kettenzentrierte Pre-training-Methode vor, um das vortrainierte Modell in der Identifizierung von multimodalen Schlussfolgerungsprozessen zu verbessern und das Problem der Daten-Sparsamkeit zu mildern. Diese Methode erstellt eine großskalige Schlussfolgerungskorpus, indem sie künstliche, heterogene Schlussfolgerungspfade aus Wikipedia synthetisiert und entsprechende Fragen generiert. Wir evaluieren unser System auf OTT-QA, einem großskaligen Benchmark für tabellen- und textbasierte, offene Domänen-Fragenbeantwortung, und erreichen dabei den Stand der Technik. Weitere Analysen zeigen, dass die explizite hybride Kette eine erhebliche Leistungssteigerung sowie eine verbesserte Interpretierbarkeit des Zwischenschlussfolgerungsprozesses bietet, und dass die kettenzentrierte Pre-training-Methode die Leistung bei der Kettenextraktion signifikant steigert.