2ヶ月前

データからテキストへの生成におけるコンテンツ選択と計画

Ratish Puduppully; Li Dong; Mirella Lapata
データからテキストへの生成におけるコンテンツ選択と計画
要約

最近のデータからテキストへの生成技術の進歩により、大規模なデータセットとエンドツーエンドで訓練されるニューラルネットワークモデルが使用されるようになりました。これらのモデルは、何をどのように順序立てて述べるかを明示的にモデリングすることなく訓練されます。本研究では、コンテンツ選択とプランニングを組み込みつつ、エンドツーエンドの訓練を犠牲にしないニューラルネットワークアーキテクチャを提案します。生成タスクを2つの段階に分解しました。まず、データレコード(説明文書とともに)のコーパスが与えられた場合、どの情報が言及されべきかおよびその順序を強調するコンテンツプランを生成します。次に、このコンテンツプランに基づいて文書を生成します。自動評価と人間による評価実験の結果、当モデルは強力なベースラインを超えており、最近公開されたRotoWireデータセットにおいて最先端の性能を向上させていることが示されました。

データからテキストへの生成におけるコンテンツ選択と計画 | 最新論文 | HyperAI超神経