
要約
ニューラル機械翻訳は、最近提案された機械翻訳の手法です。従来の統計的機械翻訳とは異なり、ニューラル機械翻訳は単一のニューラルネットワークを構築し、そのネットワークを全体として調整して翻訳性能を最大化することを目指しています。最近提案されているニューラル機械翻訳のモデルは、多くの場合エンコーダー-デコーダー系に属しており、ソース文を固定長ベクトルにエンコードするエンコーダーと、そのベクトルから翻訳を生成するデコーダーで構成されています。本論文では、固定長ベクトルの使用がこの基本的なエンコーダー-デコーダー構造の性能向上におけるボトルネックであると考えられることから、モデルがソース文の中からターゲット語の予測に関連する部分を自動的に(ソフト)検索できるように拡張することを提案します。これらの部分を明示的にハードセグメントとして形成する必要はありません。この新しいアプローチにより、英仏翻訳タスクにおいて既存の最先端フレーズベースシステムと同等の翻訳性能を達成しました。さらに、定性的分析によって、モデルが見つけた(ソフト)アライメントが我々の直感とよく一致することが明らかになりました。