2ヶ月前
テーブルの分割:テーブル質問応答における部分テーブル選択の分治法アプローチ
Wonjin Lee; Kyumin Kim; Sungjae Lee; Jihun Lee; Kwang In Kim

要約
言語モデル(LMs)を表に適用することは、2次元の表と1次元のテキストとの間にある構造的な違いにより困難です。これらの言語モデルは当初、1次元のテキストのために設計されました。さらに、線形化された表を言語モデルに適用する際には、自己注意計算においてしばしば課される最大トークン長が、大規模な表全体にわたるコンテキストの包括的理解を難しくしています。これらの課題に対処するために、私たちはPieTa(Piece of Table)という新しいサブテーブルベースの質問応答(QA)フレームワークを提案します。PieTaは、表を小さなウィンドウに分割し、各ウィンドウ内で関連するセルを選択し、それらのセルをサブテーブルに統合する反復プロセスで動作します。この多分解能アプローチは、複数の行と列にわたる依存関係を捉えつつ、長いコンテキスト入力によって引き起こされる制限を回避します。単純な反復サブテーブル結合アルゴリズムとして実装されたPieTaは、以前のサブテーブルベースのQA手法よりも性能が向上していることを示しています。