2ヶ月前

中間事前学習を用いた表の理解

Julian Martin Eisenschlos; Syrine Krichene; Thomas Müller
中間事前学習を用いた表の理解
要約

テーブルエンタイLEMENT(表の内容が文章を支持するか否定するかを二値分類するタスク)は、言語と表の構造の解析だけでなく、数値的および離散的な推論も必要とします。テキストエンタイLEMENTに関する研究は多くありますが、テーブルエンタイLEMENTについては十分に研究されていません。本研究では、TAPAS(Herzigら、2020)という表ベースのBERTモデルを適応させてエンタイLEMENTを認識させる方法を開発しました。データ拡張の利点に着目し、自動生成された数百万件の訓練例からなるバランスの取れたデータセットを作成し、ファインチューニング前の中間ステップで学習させました。この新しいデータは、テーブルエンタイLEMENTだけでなく、SQA(Iyyerら、2017)という順次的な表質問応答タスクにも有用です。BERTモデルへの長い入力例を使用するために、前処理ステップとしてテーブルプルーニング技術を評価し、精度に中程度の低下を与える代わりに訓練と予測効率を大幅に向上させました。これらの異なる手法により、TabFact(Chenら、2020)およびSQAデータセットにおける新たな最先端が達成されました。

中間事前学習を用いた表の理解 | 最新論文 | HyperAI超神経