Google met à jour l'API Interactions pour Gemini
Google a officiellement présenté l'Interactions API, sa nouvelle interface standard pour le déploiement des modèles Gemini et des agents autonomes. Cette mise à jour majeure remplace progressivement l'ancien modèle generateContent dans Google AI Studio et la documentation officielle, tout en maintenant un support continu pour les développeurs souhaitant migrer à leur rythme. Le cœur de cette nouvelle approche réside dans sa conception orientée agents. Grâce à un seul appel API, les développeurs peuvent provisionner un environnement Linux distant sécurisé où un agent peut raisonner, exécuter du code, naviguer sur le web et gérer des fichiers. L'agent Antigravity est fourni par défaut, mais des agents personnalisés peuvent être configurés avec des instructions et des sources de données spécifiques. L'API introduit également l'exécution en arrière-plan, permettant aux interactions de se poursuivre de manière asynchrone. Les capacités techniques ont été considérablement étendues. Les outils intégrés, comme Google Search et Google Maps, peuvent désormais être combinés avec des fonctions personnalisées en une seule requête, avec des retours incluant à la fois du texte et des images. Le module Deep Research bénéficie de deux versions optimisées pour la vitesse ou la profondeur, de fonctionnalités de planification collaborative, de la génération native de graphiques et d'une ancrage multimodal prenant en charge images, PDF et audio. La génération de médias est également renforcée avec de nouveaux modèles pour la création d'images, la musique et la synthèse vocale multi-intervenants. Sur le plan technique, la structure des échanges a été simplifiée. Le concept de rôles a été remplacé par un schéma basé sur des étapes typées, facilitant le suivi précis des actions utilisateur, des réflexions du modèle et des appels de fonctions. Pour optimiser les coûts et la latence, Google propose désormais des niveaux Flex et Priority. Le premier réduit les dépenses de moitié, tandis que le second garantit des temps de réponse minimaux. Les erreurs sont désormais signalées au niveau du champ exact concerné, et les interactions passées sont conservées pendant 55 jours sur les offres payantes. Pour accompagner cette transition, Google a publié un guide de migration et développe un module spécifique, gemini-interactions-api Skill, destiné à intégrer automatiquement les meilleures pratiques dans les agents de codage. Bien que l'ancienne API reste pleinement fonctionnelle, les nouvelles capacités de pointe seront prioritairement déployées sur l'Interactions API, marquant un tournant vers des workflows étatiques et orientés agents pour l'écosystème Gemini.
