
要約
近年のデータからテキスト生成に関するアプローチは、非常に成功したエンコーダ・デコーダアーキテクチャまたはその変種を採用している。これらのモデルは、流暢な(ただししばしば不正確な)テキストを生成するが、適切なコンテンツの選択や一貫性のある順序付けに関しては著しく性能が低い。これらの課題を克服するため、我々はマクロプランニング段階と生成段階からなるニューラルモデルを提案する。このアプローチは、従来の手法に類似しており、計画(planning)と表面実現(surface realization)を分離したモジュール構造を採用している。マクロプランは、エンティティ、イベント、およびそれらの相互作用といった重要なコンテンツの高レベルな構成を表すものであり、データから学習され、生成器への入力として与えられる。RotoWireおよびMLBという2つのデータからテキスト生成ベンチマークにおける広範な実験の結果、自動評価および人間評価の両面で、本手法は競合するベースラインを上回ることが明らかになった。