
要約
生成された翻訳の注意分布は、アテンションベースの再帰型ニューラルネットワーク翻訳モデルの有用な副産物であり、入力トークンと出力トークン間のソフトアライメントとして扱うことができます。本研究では、注意分布を出力翻訳の信頼性指標として使用します。注意分布を使用する2つの戦略を提示します:大規模なバック翻訳コーパスから不良翻訳をフィルタリングすること、および2つの異なる翻訳システムを組み合わせたハイブリッド設定で最良の翻訳を選択することです。手動評価では、当社の信頼性スコアと人間の判断との間に弱い相関関係しか見られませんでしたが、ユースケースでは英語↔ドイツ語および英語↔ラトビア語翻訳において、フィルタリングでは最大2.22ポイント、ハイブリッド翻訳では0.99ポイントのBLEUスコア向上が確認されました。