
要約
本論文は、音声対話システムにおけるエンドツーエンド(E2E)自然言語生成(NLG)の最初の共有タスクの実験設定と結果を要約しています。最近のエンドツーエンド生成システムは、データアノテーションの必要性を低減するため有望ですが、現在は小規模で脱辞書化されたデータセットに限られています。E2E NLG 共有タスクは、これらの新規手法がより高い辞書的豊かさ、文法的複雑さ、および多様な談話現象を含むデータセットから学習することで、より高品質な出力を生成できるかどうかを評価することを目指しています。17機関から提出された62のシステムを比較し、幅広いアプローチがカバーされています。これらには機械学習アーキテクチャ -- 多くがシーケンス・トゥ・シーケンスモデル(seq2seq)を実装しています -- および文法規則やテンプレートに基づいたシステムが含まれます。