
要約
最近のニューラルモデルは、少数のデータベースレコードに基づいて短い説明文を生成する問題において著しい進歩を遂げています。本研究では、やや難易度の高いデータからテキストへの生成タスクを提案し、現行のアプローチがこのタスクでどれほど効果的であるかを調査します。具体的には、新しい大規模なデータレコードと説明文書のペアリングされたコーパスを導入し、性能分析のために一連の抽出評価手法を提案し、現行のニューラル生成手法を使用して基準結果を得ました。実験結果は、これらのモデルが流暢なテキストを生成できるものの、人間が生成した文書を十分に近似することはできていないことを示しています。さらに、テンプレートベースの基準モデルですら一部の指標でこれらのニューラルモデルを超える性能を発揮することがありますが、コピーおよび再構築に基づく拡張手法により顕著な改善が見られました。