HyperAIHyperAI

Command Palette

Search for a command to run...

il y a un jour
NVIDIA
IA Générative

Déployez NVIDIA AI-Q sur Oracle Cloud en production

NVIDIA et Oracle Cloud Infrastructure (OCI) ont publié un guide de déploiement officiel pour leur blueprint open source NVIDIA AI-Q 2.0. Cette initiative marque une étape significative dans l'évolution des agents d'intelligence artificielle, qui sont passés des simples conversations multitours à des systèmes autonomes capables de planifier des tâches complexes, de répartir les charges de travail entre plusieurs sous-agents et d'exécuter des outils dans des environnements sécurisés. Fondé sur LangChain et le toolkit NeMo Agent Toolkit, le projet permet d'obtenir des réponses vérifiées instantanément ou de générer des rapports de recherche approfondis avec sources citées. L'architecture repose sur un routeur d'intention qui analyse chaque requête et l'achemine vers le workflow adapté. Pour les interrogations rapides, un agent de recherche superficiel utilise des outils limités. Pour les analyses complexes, un agent coordinateur mobilise des sous-agents spécialisés en planification et en recherche, le tout s'appuyant sur un système de fichiers partagé et des bac à sable pour les exécutables. La conception modulaire permet de remplacer facilement les modèles linguistiques, les bases de connaissances ou les modules d'évaluation via une configuration YAML ou le système de plugins. Le déploiement sur l'écosystème Oracle est entièrement automatisé et suit une approche infrastructure as code. Terraform provisionne les ressources réseau et de calcul, y compris un cluster Kubernetes OKE, un équilibreur de charge public, un réseau privé virtuel et un coffre de secrets pour le chiffrement des clés API. Une fois l'infrastructure en place, un chart Helm installe les trois composants principaux de l'application sur le cluster. L'ensemble du processus prend environ vingt-cinq minutes et s'inverse en une seule commande pour une désinstallation propre. Cette solution cible principalement les développeurs et ingénieurs infrastructure maîtrisant Kubernetes et les pratiques d'automatisation. Elle illustre la stratégie de NVIDIA pour intégrer ses capacités d'intelligence artificielle dans des cloud publics existants et faciliter l'adoption industrielle des agents autonomes. En offrant une architecture extensible et un déploiement reproductible, ce blueprint positionne NVIDIA AI-Q comme une référence technique pour les entreprises souhaitant expérimenter ou mettre en production des systèmes d'IA à horizon long, tout en maintenant un contrôle strict sur la sécurité des données et les coûts opérationnels.

Liens associés