HyperAIHyperAI

Command Palette

Search for a command to run...

未ラベルデータを用いたコピー機能強化アーキテクチャの事前学習による文法誤り訂正の改善

Wei Zhao; Liang Wang; Kewei Shen; Ruoyu Jia; Jingming Liu

概要

神経機械翻訳システムは、文法誤り訂正(GEC)タスクにおいて最先端のアプローチとなっています。本論文では、ソース文から変更のない単語をターゲット文にコピーする機能を追加したGEC用のコピー拡張アーキテクチャを提案します。GECは、高精度を達成するために十分なラベル付き訓練データが不足しているという問題を抱えています。そこで、当該アーキテクチャを未ラベルのOne Billion Benchmarkデータセットを使用してデノイジングオートエンコーダで事前学習し、完全に事前学習されたモデルと部分的に事前学習されたモデルとの比較を行いました。これは初めて、ソースコンテキストからの単語のコピーとシーケンス・ツー・シーケンスモデルの完全な事前学習がGECタスクで試みられたものです。さらに、トークンレベルと文レベルでのマルチタスク学習をGECタスクに導入しました。CoNLL-2014テストセットにおける評価結果は、当方の手法が最近公開された最先端の結果よりも大幅に優れていることを示しています。コードと事前学習済みモデルは、https://github.com/zhawe01/fairseq-gec で公開されています。


AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助
すぐに使える GPU
最適な料金体系

HyperAI Newsletters

最新情報を購読する
北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします
メール配信サービスは MailChimp によって提供されています
未ラベルデータを用いたコピー機能強化アーキテクチャの事前学習による文法誤り訂正の改善 | 記事 | HyperAI超神経