HyperAIHyperAI

Command Palette

Search for a command to run...

Gemma重磅发布:全新开源翻译模型引领AI翻译新潮流

今天,我们推出TranslateGemma——一套基于Gemma 3构建的全新开源翻译模型系列,包含40亿、120亿和270亿参数三种规模。该系列标志着开源翻译技术的重大进展,能够支持55种语言的高质量互译,无论用户身处何地、使用何种设备,都能实现无障碍沟通。 通过将最先进的大型模型知识高效“蒸馏”到轻量级、高性能的开源模型中,TranslateGemma在保持卓越质量的同时,实现了前所未有的效率。其核心优势在于:经过专门训练,120亿参数的TranslateGemma在WMT24++基准测试中,使用MetricX指标评估,表现超越了270亿参数的Gemma 3基线模型。这意味着开发者仅需使用不到一半的参数量,即可获得媲美甚至超越更大模型的翻译质量,显著提升处理吞吐量并降低延迟,同时不牺牲准确性。此外,40亿参数版本的表现已接近120亿参数基线模型,非常适合移动端部署。 我们在涵盖55种语言的WMT24++数据集上对TranslateGemma进行了全面测试,覆盖高资源、中等资源和低资源语言,涉及多种语言家族。结果显示,所有语言的错误率均显著下降,翻译质量与效率双双提升。 这一成果源于一项创新的两阶段微调流程,将Gemini系列模型的“语言直觉”高效迁移至开放架构中。第一阶段为监督微调(SFT),使用包含人工翻译与先进Gemini模型生成的高质量合成翻译的多样化双语数据集进行训练,有效提升低资源语言的翻译表现。第二阶段引入强化学习(RL),采用包括MetricX-QE和AutoMQM在内的多模型奖励机制,引导模型生成更自然、更符合语境的翻译结果。 TranslateGemma在语言覆盖上实现突破:在55个核心语言对上完成严格训练与评估,同时针对近500个额外语言对进行训练,为研究人员提供了强大的基础模型,便于进一步微调特定语言对或提升低资源语言质量。尽管这些扩展语言对尚未有官方评估指标,但完整列表已收录于技术报告,鼓励社区探索与研究。 此外,TranslateGemma保留了Gemma 3强大的多模态能力。在Vistra图像翻译基准测试中,其文本翻译能力的提升也显著增强了对图像中文字的翻译效果,即便未在训练中加入专门的多模态微调。 TranslateGemma三种尺寸设计灵活,适用于从云端到边缘设备的各类部署场景。我们已开放模型下载,欢迎研究人员和开发者立即体验,共同推动跨语言交流,促进全球理解与连接。

相关链接

Gemma重磅发布:全新开源翻译模型引领AI翻译新潮流 | 热门资讯 | HyperAI超神经