HyperAIHyperAI

Command Palette

Search for a command to run...

Google dévoile les trois frontières qui définissent l’avenir des modèles d’IA : intelligence, vitesse et coût à l’échelle

Michael Gerstenhaber, vice-président produit chez Google Cloud, dirige Vertex, la plateforme unifiée d’IA entreprise de Google. Son rôle consiste à fournir aux développeurs l’accès à des modèles d’IA avancés, notamment dans des scénarios agents, tout en leur offrant les outils nécessaires pour les intégrer à leurs applications. Contrairement aux acteurs qui développent des applications finales, comme Shopify ou Thomson Reuters, Gerstenhaber se concentre sur l’infrastructure et les capacités fondamentales qui permettent à ces applications de fonctionner. Son expérience dans l’IA, qui inclut une période chez Anthropic, lui a donné une vision claire des limites actuelles des modèles d’IA, notamment dans leur déploiement à grande échelle. Ce qui distingue Google selon lui, c’est son intégration verticale exceptionnelle : de la conception de puces et de centres de données à la production de modèles comme Gemini, en passant par les couches d’inférence, d’agent, de mémoire, de gouvernance et d’interfaces utilisateur. Cette maîtrise de l’écosystème lui permet d’offrir une plateforme complète et contrôlée, essentielle pour les entreprises souhaitant exploiter l’IA de manière sécurisée et évolutif. Gerstenhaber souligne une vision novatrice des limites des modèles d’IA : trois frontières se croisent simultanément. La première est l’intelligence brute — comme dans la génération de code complexe, où la qualité prime sur le temps. La deuxième est la latence : dans des cas comme le service client, une réponse rapide est cruciale, même si elle est légèrement moins précise. L’intelligence n’a plus d’effet si l’utilisateur raccroche. La troisième frontière est le coût à l’échelle. Des entreprises comme Reddit ou Meta doivent modérer des volumes massifs et imprévisibles de contenus. Elles ne peuvent pas assumer de risques financiers ou opérationnels liés à des modèles non prévisibles ou non évolutifs. Le défi ici n’est pas la puissance du modèle, mais sa capacité à fonctionner de manière économique et stable à une échelle illimitée. Il s’interroge sur le retard de l’adoption des systèmes agents, malgré des démonstrations impressionnantes. Selon lui, la technologie est encore jeune — à peine deux ans — et l’infrastructure nécessaire à son déploiement en production est absente. Il manque des modèles de vérification, d’audit, de gestion des autorisations de données, de traçabilité des décisions. Ces processus, essentiels pour la confiance et la conformité, doivent être développés, surtout dans des domaines sensibles comme la santé ou la finance. L’ingénierie logicielle est le domaine où l’IA agente progresse le plus rapidement, car elle s’inscrit naturellement dans des cycles de développement sécurisés, avec des revues humaines et des environnements de test. Pour d’autres métiers, il faut reproduire ces bonnes pratiques, en créant des cadres robustes, des workflows validés et des mécanismes de contrôle. Sans cela, l’IA restera une technologie prometteuse mais difficile à déployer à grande échelle. En résumé, selon Gerstenhaber, le prochain défi n’est pas d’aller plus loin en intelligence, mais de rendre l’IA agente fiable, auditable, sécurisée et économique à l’échelle. Google Cloud, avec sa vision intégrée, est bien positionné pour répondre à ces enjeux.

Liens associés

Google dévoile les trois frontières qui définissent l’avenir des modèles d’IA : intelligence, vitesse et coût à l’échelle | Articles tendance | HyperAI