HyperAIHyperAI

Command Palette

Search for a command to run...

MTet:英語およびベトナム語向けの多ドメイン翻訳

Chinh Ngo Trieu H. Trinh Long Phan Hieu Tran Tai Dang Hieu Nguyen Minh Nguyen Minh-Thang Luong

概要

英語-ベトナム語翻訳を対象とした、公開されている最大規模の並列コーパス「MTet」を紹介する。MTetは、420万件の高品質な学習用文対と、ベトナムの研究コミュニティによって精査されたマルチドメインテストセットから構成されている。これまでの英語-ベトナム語翻訳に関する研究と組み合わせることで、既存の並列データセットを620万文対まで拡張した。また、英語およびベトナム語向けの最初の事前学習モデル「EnViT5」も公開する。これらのリソースを統合した本モデルは、翻訳のBLEUスコアにおいて、従来の最先端モデルを最大2ポイント上回る性能を達成しつつ、モデルサイズは1.6倍小さくなっている。


AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助
すぐに使える GPU
最適な料金体系

HyperAI Newsletters

最新情報を購読する
北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします
メール配信サービスは MailChimp によって提供されています