NVIDIA DGX Spark gère l'IA
NVIDIA a annoncé le déploiement de la fonctionnalité Enterprise Manageability pour ses systèmes DGX Spark et GB10, conçue pour répondre aux exigences opérationnelles des infrastructures d'intelligence artificielle à grande échelle. Cette approche permet aux entreprises de gérer leurs clusters IA avec le même rigorisme que leurs systèmes informatiques classiques, de l'approvisionnement jusqu'à la mise hors service. Le cadre se distingue par une architecture sans agent, reposant sur l'exécution à distance via SSH et des sorties standardisées au format JSON. Cette conception facilite l'intégration directe avec les outils de supervision et d'automatisation déjà utilisés par les équipes IT, tels que Ansible, Canonical Landscape ou Tanium. Le cycle de vie complet est structuré en six phases : réception, configuration initiale, surveillance continue, maintenance planifiée, réponse aux incidents et archivage. Une séparation stricte entre les outils de lecture seule et ceux modifiant l'état du système assure une gouvernance conforme aux politiques de sécurité des grandes entreprises. Pour les environnements déconnectés d'Internet, NVIDIA propose une méthode d'installation personnalisée. Basée sur cloud-init et des dépôts locaux, elle permet de provisionner des systèmes en mode entièrement isolé, sans nécessiter d'infrastructure cloud complexe. La surveillance et le diagnostic s'appuient sur des utilitaires dédiés exécutés à distance. Ils offrent une visibilité instantanée sur la santé matérielle et logicielle, ainsi qu'une analyse structurée des redémarrages inattendus, sans interrompre les charges de travail en cours. La gestion des mises à jour repose sur un plan de contrôle coordonné qui met à jour simultanément le noyau, les pilotes GPU, le micrologiciel et les conteneurs. Le système permet des déploiements progressifs, intègre les fenêtres de maintenance prédéfinies et garantit des options de retour arrière fiables. Sur le plan sécuritaire, le modèle d'accès basé sur les rôles applique le principe du moindre privilège. Les fonctionnalités fournissent des preuves d'audit conformes aux standards de conformité, incluant la vérification du démarrage et le chiffrement des données. Cette nouvelle offre positionne les infrastructures NVIDIA DGX comme des actifs entièrement gérés, réduisant la complexité opérationnelle et facilitant l'adoption de l'IA en production. NVIDIA a publié des guides techniques détaillés couvrant l'intégration, les scripts de référence et les schémas d'installation pour accompagner les équipes informatiques dans cette transition.
