Hermes débloque des agents IA auto-améliorés sur NVIDIA
Nous Research a lancé l'agent IA autonome Hermes, qui est devenu en moins de trois mois l'agent le plus utilisé au monde selon OpenRouter, cumulant plus de 140 000 étoiles sur GitHub. Conçu pour la fiabilité et l'amélioration continue, cet outil open source fonctionne de manière autonome et indépendante des fournisseurs de modèles. Il est spécifiquement optimisé pour une utilisation locale en continu sur le matériel NVIDIA, notamment les cartes graphiques RTX, les stations de travail RTX PRO et la machine DGX Spark. La puissance de Hermes repose sur une architecture combinant son agent avec les nouveaux modèles de langage Qwen 3.6 de Alibaba. Ces modèles en poids ouverts, notamment les versions 27B et 35B milliards de paramètres, surpassent leurs prédécesseurs plus volumineux en termes d'efficacité. Le modèle Qwen 3.6 35B, par exemple, ne nécessite que 20 Go de mémoire vive tout en surpassant les modèles de 120 milliards de paramètres, tandis que le modèle 27B offre une précision équivalente à des modèles de 400 milliards de paramètres pour une taille nettement réduite. Cette efficacité permet une exécution fluide sur des équipements locaux sans dépendre de infrastructures cloud massives. Contrairement aux agents conventionnels, Hermes intègre nativement des applications de messagerie et un accès aux fichiers locaux, capable de fonctionner 24 heures sur 24. Ses fonctionnalités distinctives incluent la capacité à exécuter des tâches en plusieurs étapes et à affiner ses propres compétences en quelques secondes grâce à l'accélération des Tensor Cores de NVIDIA. La machine DGX Spark, dotée de 128 Go de mémoire unifiée et d'une puissance d'un petaflop, est présentée comme la solution idéale pour héberger ces agents en permanence. Elle permet d'exécuter des modèles complexes en toute autonomie et de gérer plusieurs charges de travail simultanément. Pour les utilisateurs et développeurs, l'installation de Hermes sur le matériel NVIDIA est simplifiée. L'agent est compatible avec des outils de gestion de modèles populaires comme llama.cpp, LM Studio et Ollama, qui sont pris en charge directement par le logiciel. NVIDIA propose également des ressources éducatives et des manuels pratiques, notamment via la série "Build It Yourself" pour apprendre à créer des agents autonomes avec NemoClaw et OpenShell. Parallèlement, NVIDIA a renforcé son écosystème avec des améliorations notables. Les cartes graphiques RTX PRO offrent désormais une génération de tokens jusqu'à trois fois plus rapide pour les modèles Qwen 3.6. Google a également mis à disposition des versions optimisées de ses modèles Gemma 4 sous forme de points de contrôle NVFP4 pour les puces Blackwell, permettant une inférence trois fois plus rapide sans perte de qualité. De même, la version 3.5 du modèle Mistral Medium a été mise à jour pour être pleinement compatible avec les systèmes NVIDIA, élargissant les possibilités d'utilisation locale. L'objectif de cette initiative est de démocratiser l'accès à une intelligence artificielle avancée et sécurisée directement sur les postes de travail des particuliers et des entreprises. En combinant des logiciels open source performants comme Hermes avec un matériel NVIDIA spécialisé, les utilisateurs peuvent désormais gérer des flux de travail complexes, planifier des tâches autonomes et améliorer leurs agents en temps réel, marquant une étape significative dans l'adoption de l'IA agentic au niveau local.
