11 天前

基于大语言模型的英越翻译系统

{Vu Anh Tran, Quoc Bao Nguyen, Thanh Trong Nguyen, Hoai Nam Nguyen}
基于大语言模型的英越翻译系统
摘要

我们提出一种革新性的英越语翻译方法,充分利用Gemma-7B-IT模型(Gemma团队等,2024)的前沿能力。通过融合基于大语言模型的翻译框架(Advanced Language Model-based Translator, ALMA)(Xu等,2023)的优化方法,本系统在处理复杂语言语境方面显著超越了传统的Transformer模型。本研究详述了我们稳健的训练框架、实验验证过程以及严格的评估流程,确立了越南语翻译任务的新标杆。实验结果显著优于现有知名系统,如VinAI Translate(Nguyen等,2022)和Google Translate(Google,2024b),相较于此前表现最佳的系统,BLEU得分提升超过12分。这一成果充分展现了集成于ALMA框架中的大语言模型(Large Language Models, LLMs)(Zhao等,2023)所具备的卓越灵活性与上下文理解能力,使其在应对多样化的翻译细微差别与语言复杂性方面表现出色。基于这些突破性进展,我们还推出了一款以用户为中心的翻译产品,现已上线,访问地址为 https://www.doctranslate.io(Doctranslate,2023)。该工具体现了我们致力于将技术创新与实际应用深度融合的承诺,为用户提供流畅、高质量的翻译体验。