2ヶ月前

非監督型機械翻訳の効果的なアプローチ

Mikel Artetxe; Gorka Labaka; Eneko Agirre
非監督型機械翻訳の効果的なアプローチ
要約

機械翻訳は従来、大量の並行コーパスに依存してきましたが、最近の研究では単一言語コーパスのみを使用してニューラル機械翻訳(NMT)および統計的機械翻訳(SMT)システムを訓練することに成功しています。本論文では、既存の非監督SMTアプローチにおけるいくつかの欠点を特定し、解決するためにサブワード情報の活用、理論的に堅固な非監督調整手法の開発、および共同最適化手順の導入を行いました。さらに、改善されたSMTシステムを用いて双方向NMTモデルを初期化し、オンザフライ逆翻訳を通じて微調整を行いました。これらの手法により、非監督機械翻訳におけるこれまでの最先端技術に対して大幅な改善を達成しました。例えば、英語からドイツ語へのWMT 2014において22.5 BLEUポイントを獲得し、これまでの最高の非監督システムよりも5.5ポイント高く、また2014年の(教師あり)共有タスク優勝者よりも0.5ポイント高い結果を得ました。

非監督型機械翻訳の効果的なアプローチ | 最新論文 | HyperAI超神経