HyperAIHyperAI

Command Palette

Search for a command to run...

Hermes setzt NVIDIA RTX und DGX Spark für selbstverbessernde KI-Agenten ein

Nous Research hat Hermes Agent veröffentlicht, eine neuartige KI-Lösung, die sich durch automatische Selbstverbesserung und lokale Ausführung auszeichnet. Innerhalb von drei Monaten erreichte das Open-Source-Projekt über 140.000 Sternchen auf GitHub und gilt derzeit laut OpenRouter als das weltweit meistgenutzte Agenten-Framework. Im Gegensatz zu vielen anderen Systemen ist Hermes weder an einen bestimmten Dienstleister noch an ein spezifisches Modell gebunden. Sein Design zielt primär auf einen dauerhaft laufenden Betrieb am lokalen Rechner ab, was NVIDIA RTX PCs, RTX PRO Workstations und das kompakte DGX Spark-System zur idealen Hardware-Plattform macht. Zur Steuerung des Agenten kommen die neuen Qwen 3.6 Large Language Models von Alibaba zum Einsatz. Diese hochleistungsfähigen, offenen Modelle übertreffen ihre Vorgängergenerationen bei deutlich geringerem Ressourcenbedarf. Das Qwen 3.6 35B-Modell benötigt etwa 20 Gigabyte Arbeitsspeicher und übertrifft dabei die Leistung von Modellen mit 120 Milliarden Parametern, die für den Betrieb mehr als 70 Gigabyte benötigen. Ein weiteres neues Modell, das Qwen 3.6 27B, erreicht durch eine höhere Anzahl aktiver Parameter die Genauigkeit von Modellen mit 400 Milliarden Parametern, ist dabei aber sechzehnmal kompakter. Diese Effizienz ermöglicht es, komplexe Aufgaben auch auf lokaler Hardware mit hoher Geschwindigkeit zu verarbeiten. Die Kombination aus Hermes und NVIDIA-Hardware bietet vier zentrale Vorteile. Erstens läuft sowohl der Agent als auch das zugrundeliegende Sprachmodell vollständig lokal, wodurch die Rechenleistung direkt die Nutzererfahrung bestimmt. Zweitens gewährleisten NVIDIA RTX Grafikkarten, die speziell für solche Workloads entwickelt wurden, eine stabile Performance. Drittens beschleunigen die Tensor Cores der NVIDIA-GPUs die Inferenz, was die Latenzzeit senkt und Durchsatzraten erhöht. In der Praxis bedeutet dies, dass Hermes komplexe, mehrstufige Aufgaben oder die Verfeinerung eigener Fähigkeiten in Sekunden statt in Minuten abschließen kann. Viertens stellt NVIDIA DGX Spark eine dedizierte, kompakte Maschine für ununterbrochene Arbeitsabläufe dar. Mit 128 Gigabyte Unified Memory und einer Rechenleistung von einer Petaflop kann sie selbst Modelle mit 120 Milliarden Parametern den ganzen Tag über betreiben, während die neuen Qwen-Modelle eine noch effizientere Nutzung für gleichzeitige Aufgaben ermöglichen. Für Entwickler und Nutzer ist der Einstieg einfach gestaltet. Das Hermes-Repository auf GitHub bietet eine direkte Startmöglichkeit, die mit verschiedenen Laufzeitumgebungen wie llama.cpp, LM Studio oder Ollama kombiniert werden kann. Beide Programme bieten bereits integrierte Unterstützung für Hermes, was den Aufbau autonomer lokaler Agenten vereinfacht. NVIDIA fördert diese Ökosystem-Entwicklung zudem durch neue Ressourcen, darunter das Open-Source-Stack NemoClaw, das die Sicherheit erhöht und die Unterstützung für das Windows Subsystem for Linux erweitert. Zusätzlich werden fortlaufend Updates zu optimierten Modellen wie Google Gemma und Mistral Medium veröffentlicht, die speziell für NVIDIA-GPUs angepasst sind. Die Verfügbarkeit von DGX Spark läuft bereits über die Herstellungspartner von NVIDIA. Die Integration dieser Technologien markiert einen bedeutenden Schritt in der Entwicklung autonomer Software, da sie Benutzern nun leistungsfähige Werkzeuge zur Verfügung stellt, die ihre eigenen Arbeitsabläufe autonom planen, ausführen und verbessern können. Durch die Kombination aus effizienten Open-Source-Modellen und spezialisierter lokaler Hardware wird die Grenze zwischen lokaler Verarbeitung und leistungsfähiger KI zunehmend verwischt.

Verwandte Links