HyperAIHyperAI

Command Palette

Search for a command to run...

Google lance son agent de recherche IA le plus puissant, juste avant le lancement d’OpenAI GPT-5.2

Google a lancé jeudi une nouvelle version réinventée de son agent de recherche avancée, Gemini Deep Research, basée sur son modèle fondamental dernier cri, Gemini 3 Pro. Ce nouvel outil n’est pas seulement conçu pour générer des rapports de recherche – bien qu’il en soit toujours capable – mais il permet désormais aux développeurs d’intégrer directement les capacités de recherche profonde de Google dans leurs propres applications. Cette fonctionnalité repose sur une nouvelle API, l’Interactions API, conçue pour offrir aux développeurs un meilleur contrôle dans l’ère émergente des systèmes d’IA agents. Gemini Deep Research est un agent capable de traiter de vastes quantités d’informations et de gérer des entrées très longues dans les prompts. Google affirme qu’il est déjà utilisé pour des tâches complexes, allant de la due diligence à l’analyse de la toxicité des médicaments. La société prévoit également d’intégrer ce nouvel agent dans plusieurs de ses services, notamment Google Search, Google Finance, l’application Gemini et NotebookLM. Ces évolutions marquent une étape supplémentaire vers un futur où les utilisateurs ne cherchent plus eux-mêmes sur Internet, mais où leurs agents IA le font à leur place. Google souligne que Deep Research bénéficie de la réputation de Gemini 3 Pro comme étant son modèle « le plus fiable », entraîné pour minimiser les hallucinations – ces erreurs où un modèle de langage génère des informations fausses ou inventées. Ce problème est particulièrement critique dans les tâches complexes et prolongées, où l’agent doit prendre plusieurs décisions autonomes sur plusieurs minutes, heures ou même jours. Plus le nombre de choix augmente, plus le risque qu’une seule erreur de ce type invalide l’ensemble du résultat devient élevé. Pour étayer ses affirmations, Google a développé un nouveau benchmark, baptisé DeepSearchQA, destiné à évaluer les agents sur des tâches d’information complexes à plusieurs étapes. L’entreprise a également mis ce benchmark à disposition du public. Elle a testé son agent sur d’autres évaluations, comme Humanity’s Last Exam – un benchmark indépendant réputé pour ses questions extrêmement spécialisées – ainsi que sur BrowserComp, qui mesure les performances des agents dans des tâches réalisées via navigateur. Résultat : Gemini Deep Research s’est imposé sur DeepSearchQA et Humanity’s Last Exam, tandis que ChatGPT 5 Pro d’OpenAI s’est montré un adversaire redoutable, se classant en deuxième position sur toutes les épreuves et même devançant Google sur BrowserComp. Mais ces résultats ont rapidement perdu de leur actualité. Le jour même du lancement de Google, OpenAI a dévoilé GPT-5.2, surnommé Garlic. Selon la société, ce nouveau modèle surpasserait ses concurrents, en particulier Google, sur une série de benchmarks classiques, dont ceux développés par OpenAI. L’annonce a été particulièrement marquante non seulement par le contenu, mais aussi par son timing : sachant que le monde attendait le lancement de Garlic, Google a choisi ce moment pour présenter ses propres avancées. Une stratégie qui illustre la course sans fin entre les géants de l’IA.

Liens associés