
要約
英語-ベトナム語翻訳の分野において、Gemma-7B-IT(Gemma Team et al. 2024)モデルの最先端の能力を活用した画期的なアプローチを提案する。本研究では、Advanced Language Model-based Translator(ALMA)(Xu et al. 2023)の手法を統合することで、従来のTransformerモデルに比べ、複雑な言語的文脈をより効果的に処理できるシステムを構築した。本研究では、堅牢な学習フレームワーク、実験的検証、および厳密な評価プロセスを詳細に提示し、ベトナム語翻訳タスクにおける新たなSOTA(State-of-the-Art)を確立した。実験結果は、VinAI Translate(Nguyen et al. 2022)やGoogle Translate(Google 2024b)といった著名なシステムを大きく上回り、従来のトップパフォーマンスを記録したシステムと比較して12以上のBLEUスコアの向上を達成した。これらの成果は、ALMAフレームワーク内に統合された大規模言語モデル(LLMs)(Zhao et al. 2023)の優れた柔軟性と文脈理解能力が、多様な翻訳のニュアンスや複雑性に対応する上で顕著な優位性を発揮していることを示している。こうした革新的な進展を活かし、ユーザー中心の翻訳ツール「Doctranslate」(https://www.doctranslate.io, Doctranslate 2023)を提供した。本ツールは、技術革新と実用性の融合を実現するという当研究の理念を体現しており、ユーザーにシームレスかつ高品質な翻訳体験を提供することを目指している。