Google prend la tête des modèles d'embedding avec Gemini, mais Alibaba rattrape avec son alternative open source
Google prend la tête des modèles d'embedding avec Gemini, tandis qu'un concurrent open source d'Alibaba resserre la course Le 18 juillet 2025, Google a officiellement rendu disponible son modèle d'embedding haute performance Gemini Embedding au grand public. Le modèle, connu sous le nom gemini-embedding-001, est désormais une composante essentielle de l'API Gemini et de la plateforme Vertex AI. Cette annonce a créé un tremblement de terre dans le classement Massif Text Embedding Benchmark (MTEB), où Gemini occupe désormais la première place. À l'intérieur du modèle d'embedding Gemini Les modèles d'embedding permettent de convertir le texte (ou d'autres types de données) en listes numériques qui capturent les caractéristiques clés de l'entrée. Dans cet espace numérique, les données ayant une signification sémantique similaire présentent des valeurs d'embedding proches. Cela ouvre la voie à des applications avancées, comme la recherche sémantique et la génération améliorée par la recherche (RAG). Les embeddings peuvent également être utilisés pour d'autres modalités, tels que les images, la vidéo et l'audio. Par exemple, une entreprise de commerce électronique pourrait utiliser un modèle d'embedding multimodal pour générer une représentation numérique unifiée d'un produit, combinant à la fois des descriptions textuelles et des images. Pour les entreprises, les modèles d'embedding peuvent améliorer la précision des moteurs de recherche internes, simplifier le clustering et la classification des documents, mener des analyses de sentiments et détecter les anomalies. De plus, ces modèles deviennent essentiels dans les applications ageniques, où les agents IA doivent retrieve et matcher différents types de documents et de prompts. L'un des principaux atouts de Gemini Embedding est sa flexibilité. Grâce à une technique appelée Matryoshka Representation Learning (MRL), les développeurs peuvent obtenir une représentation détaillée de 3072 dimensions tout en ayant la possibilité de la tronquer à des tailles plus petites, comme 1536 ou 768, tout en préservant ses caractéristiques les plus pertinentes. Cette flexibilité permet aux entreprises de trouver un équilibre entre la précision du modèle, les performances et les coûts de stockage, ce qui est crucial pour le scaling des applications. Google présente Gemini Embedding comme un modèle unifié conçu pour fonctionner efficacement hors de la boîte dans divers domaines, tels que la finance, le juridique et l'ingénierie, sans nécessiter de fine-tuning. Pris en charge par plus de 100 langues et tarifé à 0.15$ par million de tokens d'entrée, il est conçu pour être largement accessible. Une competion accrue entre modèles propriétaires et open source Le classement MTEB montre que bien que Gemini occupe la première place, son avantage est mince. Il fait face à des modèles établis comme ceux d'OpenAI, largement utilisés dans l' industrie, et à des modèles spécialisés tels que Mistral, conçu spécifiquement pour la récupération de code. L'émergence de ces modèles spécialisés suggère qu'en certaines situations, un outil ciblé peut surpasser un modèle généraliste. Un autre acteur important, Cohere, vise directement les entreprises avec son modèle Embed 4. Alors que d'autres modèles se mesurent sur des benchmarks généraux, Cohere souligne sa capacité à traiter les données bruyantes du monde réel souvent trouvées dans les documents d'entreprise, telles que des erreurs orthographiques, des problèmes de formatage et même des écritures manuscrites scannées. Cohere offre également une déploiement dans des clouds privés virtuels ou sur site, assurant un niveau de sécurité des données qui séduit les industries réglementées comme la finance et la santé. La menace la plus directe contre l'hégémonie des modèles propriétaires provient de la communauté open source. Le modèle Qwen3-Embedding d'Alibaba occupe une position juste derrière Gemini sur le classement MTEB et est disponible sous une licence Apache 2.0 permissive (usage commercial autorisé). Pour les entreprises axées sur le développement logiciel, Qodo-Embed-1-1.5B de Qodo est une autre alternative open source attrayante, spécialement conçue pour le code et affirmant surpasser les modèles plus volumineux sur des benchmarks spécifiques au domaine. Choix stratégique pour les entreprises Pour les entreprises déjà engagées sur Google Cloud et utilisant la famille de modèles Gemini, l'adoption du modèle d'embedding natif peut offrir plusieurs avantages, notamment une intégration fluide, une pipeline MLOps simplifiée et la garantie d'utiliser un modèle généraliste classé en tête. Cependant, Gemini est un modèle fermé, accessible uniquement via une API. Les entreprises qui accordent de l'importance à la souveraineté des données, au contrôle des coûts ou à la capacité de faire tourner des modèles sur leur propre infrastructure disposent maintenant d'options crédibles et de haut niveau en open source, comme Qwen3-Embedding ou des modèles d'embedding spécifiques à une tâche. Évaluation par les professionnels de l'industrie Cette avancée de Google souligne son engagement continu dans le domaine de l'IA et sa capacité à offrir des solutions de pointe. Cependant, le paysage des modèles d'embedding reste hautement compétitif, avec des alternatives open source qui offrent des fonctionnalités presque équivalentes à moindre coût et plus de liberté de déploiement. Pour beaucoup, cette dualité entre modèles propriétaires et open source reflète l'évolution plus large de l'industrie technologique vers une adoption plus flexible des outils, où les entreprises peuvent choisir la meilleure solution adaptée à leurs besoins spécifiques, qu'il s'agisse de performance pure ou de contrôlabilité. Profil de l'entreprise Google est une entreprise de technologie majeure, reconnue pour ses innovations en matière d'IA et de cloud computing. La disponibilité de Gemini Embedding renforce sa position dans l'écosystème des outils IA, offrant aux développeurs et aux entreprises des options performantes et polyvalentes. De son côté, Alibaba continue de prouver sa pertinence en proposant des solutions open source de qualité, permettant un déploiement plus flexible et une adaptation plus aisée aux besoins spécifiques des entreprises, particulièrement utile pour celles cherchant à maintenir un contrôle maximal sur leur infrastructure et leurs données. Cette annonce marque donc un tournant important dans le domaine des modèles d'embedding, où le choix pour les entreprises n'est plus seulement guidé par la performance mais aussi par la flexibilité, l'accessibilité et l'autonomie.