HyperAI超神经

今天，我们推出TranslateGemma——一套基于Gemma 3构建的全新开源翻译模型系列，包含40亿、120亿和270亿参数三种规模。该系列标志着开源翻译技术的重大进展，能够支持55种语言的高质量互译，无论用户身处何地、使用何种设备，都能实现无障碍沟通。通过将最先进的大型模型知识高效“蒸馏”到轻量级、高性能的开源模型中，TranslateGemma在保持卓越质量的同时，实现了前所未有的效率。其核心优势在于：经过专门训练，120亿参数的TranslateGemma在WMT24++基准测试中，使用MetricX指标评估，表现超越了270亿参数的Gemma 3基线模型。这意味着开发者仅需使用不到一半的参数量，即可获得媲美甚至超越更大模型的翻译质量，显著提升处理吞吐量并降低延迟，同时不牺牲准确性。此外，40亿参数版本的表现已接近120亿参数基线模型，非常适合移动端部署。我们在涵盖55种语言的WMT24++数据集上对TranslateGemma进行了全面测试，覆盖高资源、中等资源和低资源语言，涉及多种语言家族。结果显示，所有语言的错误率均显著下降，翻译质量与效率双双提升。这一成果源于一项创新的两阶段微调流程，将Gemini系列模型的“语言直觉”高效迁移至开放架构中。第一阶段为监督微调（SFT），使用包含人工翻译与先进Gemini模型生成的高质量合成翻译的多样化双语数据集进行训练，有效提升低资源语言的翻译表现。第二阶段引入强化学习（RL），采用包括MetricX-QE和AutoMQM在内的多模型奖励机制，引导模型生成更自然、更符合语境的翻译结果。 TranslateGemma在语言覆盖上实现突破：在55个核心语言对上完成严格训练与评估，同时针对近500个额外语言对进行训练，为研究人员提供了强大的基础模型，便于进一步微调特定语言对或提升低资源语言质量。尽管这些扩展语言对尚未有官方评估指标，但完整列表已收录于技术报告，鼓励社区探索与研究。此外，TranslateGemma保留了Gemma 3强大的多模态能力。在Vistra图像翻译基准测试中，其文本翻译能力的提升也显著增强了对图像中文字的翻译效果，即便未在训练中加入专门的多模态微调。 TranslateGemma三种尺寸设计灵活，适用于从云端到边缘设备的各类部署场景。我们已开放模型下载，欢迎研究人员和开发者立即体验，共同推动跨语言交流，促进全球理解与连接。

相关链接

相关链接

相关链接

教程汇总丨开源小模型综合智能水平追平 GPT-5，一站测评 Qwen 3.5/Gemma 4 等热门模型

教程汇总丨开源小模型综合智能水平追平 GPT-5，一站测评 Qwen 3.5/Gemma 4 等热门模型

Command Palette

Gemma重磅发布：全新开源翻译模型引领AI翻译新潮流

相关链接

Command Palette

Gemma重磅发布：全新开源翻译模型引领AI翻译新潮流

相关链接

Command Palette

Gemma重磅发布：全新开源翻译模型引领AI翻译新潮流

相关链接

教程汇总丨开源小模型综合智能水平追平 GPT-5，一站测评 Qwen 3.5/Gemma 4 等热门模型

教程汇总丨开源小模型综合智能水平追平 GPT-5，一站测评 Qwen 3.5/Gemma 4 等热门模型