
要約
近年、不完全発話の書き換えタスクが大きな注目を集めています。従来の研究では、このタスクを機械翻訳の問題として扱い、コピー機構を備えたシーケンス・ツー・シーケンス(Sequence-to-Sequence)アーキテクチャを使用していました。本論文では、新たなかつ包括的なアプローチを提案し、この問題を意味分割タスクとして定式化します。ゼロから生成するのではなく、このような定式化は編集操作を導入し、問題を単語レベルの編集行列の予測として捉えます。局所情報と全体情報を両方キャプチャできるという利点により、当社のアプローチはいくつかの公開データセットで最先端の性能を達成しています。さらに、推論速度において当社のアプローチは標準的なアプローチよりも4倍速いです。