2ヶ月前
ニューラルデータからテキスト生成:パイプラインアーキテクチャとエンドツーエンドアーキテクチャの比較
Thiago Castro Ferreira; Chris van der Lee; Emiel van Miltenburg; Emiel Krahmer

要約
従来、多くのデータからテキストへの変換アプリケーションは、非言語的な入力データを複数の中間変換を通じて自然言語に変換するモジュラーパイプラインアーキテクチャを使用して設計されてきました。これに対して、最近のデータからテキストを生成するためのニューラルモデルでは、エンドツーエンドアプローチが提案されています。この方法では、非言語的な入力データが明示的な中間表現をほとんど介さずに自然言語で表現されます。本研究では、RDFトリプルからテキストを生成するために使用されるニューラルパイプラインとエンドツーエンドアプローチの間で系統的な比較を行います。両方のアーキテクチャは、最新の深層学習手法であるエンコーダー-デコーダー構造のゲート付きリカレントユニット(GRU)およびトランスフォーマーを利用し実装されました。自動評価と人間による評価および質的分析の結果、生成過程において明示的な中間ステップを持つ方が、エンドツーエンドアプローチよりも優れたテキストが生成されると示唆されています。さらに、パイプラインモデルは未見の入力に対する汎化能力が高いことがわかりました。データとコードは公開されています。