Gemini 3.5 Flash intègre nativement le computer use
Google a intégré nativement la capacité d'utilisation d'ordinateur au sein de son modèle Gemini 3.5 Flash. Cette fonctionnalité, précédemment réservée à un modèle autonome Gemini 2.5, devient désormais un outil directement inclus dans la version Flash. Elle permet aux développeurs de concevoir des agents capables d'analyser, de raisonner et d'interagir de manière fiable avec les environnements web, mobiles et de bureau. En s'appuyant sur les forces existantes du modèle en matière d'appels de fonctions et d'intégration d'outils comme la recherche ou Maps, cette mise à jour vise à fluidifier les tâches complexes et à longue durée d'exécution. Elle est particulièrement indiquée pour l'automatisation en entreprise, les tests logiciels continus et les travaux intellectuels nécessitant une interaction prolongée avec des applications professionnelles. L'accès à cette fonctionnalité est immédiat via l'API Gemini et la plate-forme Gemini Enterprise Agent Platform. Google a déjà démontré son utilité pratique en utilisant l'agent pour cartographier les fonctionnalités de l'application et pour auditer sa documentation technique afin d'en identifier les problèmes d'accessibilité. La sécurité a été priorisée lors de ce déploiement. Pour contrer les risques d'injection de prompt, Google a appliqué un entraînement adversarial ciblé spécifiquement conçu pour cette capacité. Deux mécanismes de protection supplémentaires, facultatifs et destinés aux entreprises, sont également proposés. Le premier impose une confirmation explicite de l'utilisateur pour toute action sensible ou irréversible. Le second arrête automatiquement une tâche si une injection indirecte est détectée. L'entreprise recommande par ailleurs une approche de défense en profondeur, encourageant l'usage combiné de sandboxing sécurisé, de vérification humaine et de contrôles d'accès stricts. Les retours préliminaires indiquent déjà une adoption rapide et une génération de valeur pour les premiers clients. Une démo interactive est accessible via Browserbase, tandis que la documentation technique et les références pour le développement sont publiées sur les canaux officiels de Google.
