Qwen3 嵌入:通过基础模型推进文本嵌入和重排序
Zhang, Yanzhao ; Li, Mingxin ; Long, Dingkun ; Zhang, Xin ; Lin, Huan ; Yang, Baosong ; Xie, Pengjun ; Yang, An ; Liu, Dayiheng ; Lin, Junyang ; Huang, Fei ; Zhou, Jingren
发布日期: 6/8/2025

摘要
在这项工作中,我们介绍了Qwen3嵌入系列模型,这是在文本嵌入和重排序能力方面对其前身GTE-Qwen系列的重要改进,基于Qwen3基础模型构建。借助Qwen3大语言模型(LLMs)在多语言文本理解和生成方面的强大能力,我们创新的多阶段训练管道结合了大规模无监督预训练和在高质量数据集上的有监督微调。有效的模型融合策略进一步确保了Qwen3嵌入系列的鲁棒性和适应性。在训练过程中,Qwen3大语言模型不仅作为骨干模型发挥作用,还在多个领域和多种语言中合成高质量、丰富且多样化的训练数据,从而增强了训练管道。Qwen3嵌入系列提供了不同规模的模型(0.6亿参数、4亿参数、8亿参数),适用于嵌入和重排序任务,满足各种部署场景的需求,用户可以根据效率或效果进行优化选择。实证评估表明,Qwen3嵌入系列在多个基准测试中取得了最先进的结果。特别值得一提的是,它在多语言评估基准MTEB的文本嵌入任务以及各种检索任务(包括代码检索、跨语言检索和多语言检索)中表现出色。为了促进可重复性和推动社区驱动的研究与开发,Qwen3嵌入模型已根据Apache 2.0许可公开发布。