16日前
データからテキスト生成への階層モデル
Clément Rebuffel, Laure Soulier, Geoffrey Scoutheeten, Patrick Gallinari

要約
構造化データを自然言語の記述に変換するというタスクは、「データからテキスト生成(data-to-text)」と呼ばれる難易度の高い課題として注目されている。これらの構造は、一般的に複数の要素およびそれらの属性を統合したものである。従来のアプローチは、主にエンコーダ-デコーダ型の翻訳手法に依拠しており、要素を一連の順序に線形化する。しかし、この手法ではデータに内在する構造情報の大部分を失ってしまうという問題がある。本研究では、要素レベルおよび構造レベルの両方でデータ構造を符号化する階層型モデルを提案することで、この制約を克服することを目的とする。RotoWireデータセットを用いた評価により、本モデルが定量的および定性的な指標において有効性を示したことが確認された。