2ヶ月前

構造認識型Seq2seq学習によるテーブルからテキストの生成

Tianyu Liu; Kexiang Wang; Lei Sha; Baobao Chang; Zhifang Sui
構造認識型Seq2seq学習によるテーブルからテキストの生成
要約

テーブルからテキストの生成は、事実関係のテーブルをフィールド-値レコードの集合として捉え、その説明を生成することを目指しています。テーブルの内容と構造をエンコードするために、私たちは新しい構造認識型 seq2seq アーキテクチャを提案します。このアーキテクチャは、フィールドゲーティングエンコーダと双方向注意メカニズムを持つ記述ジェネレータで構成されています。エンコーディングフェーズでは、LSTM ユニットのセルメモリをフィールドゲートとその対応するフィールド値によって更新し、フィールド情報をテーブル表現に組み込むことができます。デコーディングフェーズでは、単語レベルの注意とフィールドレベルの注意を含む双方向注意メカニズムが提案され、生成された記述とテーブルとの意味的な関連性をモデル化します。私たちは \texttt{WIKIBIO} データセット(ウィキペディアから取得した70万件以上の伝記と対応する情報ボックスを含む)上で実験を行いました。注意可視化とケーススタディは、私たちのモデルがテーブルの内容と構造に対する包括的な理解に基づいて一貫性があり且つ情報量豊富な記述を生成できる能力を持っていることを示しています。自動評価でも、私たちのモデルはベースラインに対して大幅に優れていることが確認されました。本研究に関するコードは https://github.com/tyliupku/wiki2bio で公開されています。

構造認識型Seq2seq学習によるテーブルからテキストの生成 | 最新論文 | HyperAI超神経