HyperAIHyperAI

Command Palette

Search for a command to run...

Gemini Robotics-ER 1.6 booste le raisonnement robotique

Google a officiellement lancé Gemini Robotics-ER 1.6, une mise à jour majeure de son modèle d'intelligence artificielle conçu pour améliorer le raisonnement physique des robots. Ce développement intervient alors que les systèmes robotiques doivent dépasser l'exécution simple d'instructions pour véritablement comprendre et s'adapter à leur environnement. Le modèle, baptisé « raisonnement incarné », permet aux machines de faire le pont entre l'intelligence numérique et l'action physique, essentiel pour des tâches allant de la navigation en milieu complexe à l'interprétation de données visuelles. Cette version se distingue par des capacités de raisonnement spatial et de compréhension multi-vues nettement renforcées. Contrairement aux versions précédentes, notamment Gemini Robotics-ER 1.5 et Gemini 3.0 Flash, le nouveau modèle offre une précision inédite dans des domaines critiques comme le pointage, le comptage et la détection de succès d'une tâche. Il sert de cerveau de haut niveau pour les agents robotiques, capable de planifier des missions et de vérifier leur achèvement en temps réel. Le système est également capable d'exécuter des actions en appelant nativement des outils externes, tels que Google Search, des modèles de vision-langage-action ou des fonctions personnalisées par les utilisateurs. Une fonctionnalité nouvelle et particulièrement importante a été introduite : la lecture d'instruments. Grâce à cette capacité, les robots peuvent désormais interpréter des jauges de pression complexes et des verres de visée. Cette avancée, rendue possible grâce à une collaboration étroite avec le partenaire de Google, Boston Dynamics, ouvre la voie à des applications industrielles où la précision de la lecture de données est vitale. Elle démontre la capacité du modèle à assimiler des informations visuelles nuancées et à les traduire en décisions opérationnelles concrètes. Pour les développeurs, l'accès à Gemini Robotics-ER 1.6 est immédiatement disponible via l'API Gemini et l'interface Google AI Studio. Afin d'accompagner cette diffusion, Google a mis à disposition un document Colab contenant des exemples pratiques pour configurer le modèle et lui soumettre des tâches de raisonnement incarné. L'objectif est d'accélérer l'intégration de ces capacités d'autonomie avancée dans la prochaine génération d'agents physiques, qu'ils soient destinés à la logistique, à la maintenance industrielle ou à l'assistance quotidienne. Cette mise à jour marque une étape significative vers l'automatisation réelle, où les robots ne se contentent plus de suivre des codes préenregistrés, mais adaptent leur comportement en fonction de l'état dynamique de leur environnement. En améliorant la compréhension spatiale et la capacité à raisonner sur les objets physiques, Gemini Robotics-ER 1.6 consolide la transition vers des systèmes robotiques plus intelligents et plus fiables.

Liens associés