Déployez des agents IA avec AWS Strands et AgentCore
Amazon Web Services a présenté une nouvelle approche pour le développement et le déploiement d’agents d’intelligence artificielle, associant un framework open-source à une plateforme cloud managée. Cette solution vise à simplifier le passage de la phase de prototype à celle de production pour les équipes de développement. Le premier pilier, Strands, est un framework open-source qui permet de définir le comportement des agents, de gérer les interactions avec les grands modèles de langage et d’intégrer des outils personnalisés. Son rôle se rapproche de celui d’outils comme LangChain ou CrewAI. Il offre une liberté totale sur la logique métier, le choix du modèle d’IA et la rédaction des instructions système. Le second pilier, Amazon Bedrock AgentCore, prend le relais pour la gestion opérationnelle. Il fournit un environnement cloud sécurisé et évolutif, capable d’héberger des agents construits avec Strands ou d’autres frameworks. AgentCore gère automatiquement l’isolation des sessions, la scalabilité, les politiques d’accès et la sécurité des appels API. Il ne contrôle pas le comportement du modèle, mais assure la fiabilité et la surveillance de son exécution en production. Un exemple concret de cette synergie est le déploiement d’un assistant éducatif spécialisé. L’agent est programmé pour reconnaître et répondre à des questions de mathématiques, physique, chimie ou géographie. Plutôt que d’utiliser des mots-clés rigides, le modèle d’IA analyse la requête et décide lui-même du domaine pertinent. Cette approche flexible gère aisément les questions interdisciplinaires, tout en refusant poliment les sujets hors périmètre. Au-delà des conversations éphémères, AgentCore intègre une fonctionnalité de mémoire à long terme. Contrairement aux identifiants de session qui ne conservent les échanges que pendant une discussion, la mémoire persistante stocke et extrait des préférences utilisateur. Grâce à un identifiant opaque fourni par l’application, l’agent peut rappeler le style de réponse préféré d’un utilisateur, comme adopter un ton humoristique ou adapter le niveau de détail, et ce, d’une session à l’autre. Le processus de développement s’effectue en plusieurs étapes. Les développeurs initialisent le projet localement, testent les réponses et ajustent les paramètres. Une fois validés, les agents sont déployés sur AWS via une interface en ligne de commande qui provisionne automatiquement les ressources nécessaires, incluant les rôles d’identité et les politiques d’accès. Sur le plan économique, Strands reste gratuit, mais les coûts demeurent liés à l’utilisation des modèles d’IA sous-jacents et à l’infrastructure gérée par AgentCore. Les entreprises ne paient que pour les ressources effectivement consommées. Cette architecture distingue clairement la logique applicative de l’infrastructure d’exécution. Elle permet aux équipes de concentrer leurs efforts sur l’intelligence des agents tout en s’appuyant sur des services cloud éprouvés pour la sécurité, la surveillance et la gestion de la persistance des données. À mesure que l’adoption des agents d’IA s’accélère, cette séparation des responsabilités pourrait devenir un standard pour le développement professionnel d’applications autonomes.
