谷歌Gemini嵌入模型登顶MTEB,阿里巴巴开源Qwen3紧追不舍
谷歌已经正式推出了其高性能的Gemini嵌入模型(gemini-embedding-001),并在广受好评的大型文本嵌入基准测试(MTEB)中排名第一。该模型现在成为了Gemini API和Vertex AI的核心部分,支持开发者构建语义搜索和增强型生成(RAG)等应用。 嵌入模型的基本原理是将文本或其它数据类型转换为能捕捉输入数据关键特征的数字列表。类似的语义内容在数值空间中的距离会更近,这使得嵌入模型能够实现超越简单关键词匹配的强大应用。例如,在电商领域,多模态嵌入模型可以生成统一的数字表示,结合文本描述和图像信息来展示产品。 谷歌的Gemini嵌入模型具有高度灵活性,通过马特里欧沙卡表示学习(MRL)技术训练,能够生成高精度的3072维度嵌入,同时也支持截断到1536或768维度而保留重要特征。这一特性使企业在平衡模型准确性、性能和存储成本时更加得心应手,有助于高效地扩展应用。此外,Gemini嵌入模型还能够“开箱即用”地应用于金融、法律和工程等多个领域,支持百种语言,并以每百万输入标记0.15美元的竞争力价格面向市场推广,便于广泛采用。 尽管谷歌的模型排名第一,但嵌入模型的竞争异常激烈。排行榜显示,OpenAI、Mistral等公司的模型紧随其后,其中Mistral特别擅长代码检索任务。另一家专注于企业市场的公司Cohere则强调其Embed 4模型处理真实世界嘈杂数据的能力,如拼写错误、格式问题和扫描的手写内容,同时提供虚拟私有云和本地部署选项,满足金融和医疗等高监管行业的需求。 来自开源社区的挑战尤为值得注意。阿里云的Qwen3-嵌入模型在MTEB榜单上紧追谷歌,采用Apache 2.0许可协议。对于专注于软件开发的企业,Qodo的Qodo-Embed-1-1.5B提供了一个针对代码优化的开源替代方案,宣称在特定领域的基准测试中表现优于较大的模型。 对于已经基于谷歌云和Gemini系列模型构建应用的公司,采用原生的Gemini嵌入模型可以带来诸多好处,包括无缝集成、简化MLOps管道和使用顶级通用模型的保证。然而,对于注重数据主权、成本控制或希望在自有基础设施上运行模型的企业,Qwen3-嵌入或其他任务专用模型提供了可信的顶级开源选择。