OpenClaw und NVIDIA NemoClaw für lokale KI
NVIDIA hat mit NemoClaw eine Open-Source-Referenzarchitektur vorgestellt, die entwickelt wurde, um lokale KI-Agenten sicher zu betreiben und sie von einfachen Frage-Antwort-Systemen zu autonomen Assistenten weiterzuentwickeln. Diese neuen Agenten sind in der Lage, Dateien zu lesen, APIs aufzurufen und komplexe, mehrstufige Workflows autonom durchzuführen. Da die Ausführung von Code und der Zugriff auf externe Tools erhebliche Sicherheitsrisiken bergen können, insbesondere in der Cloud, stellt NemoClaw eine Lösung für eine vollständige Isolation dar. Das System besteht aus mehreren Schlüsselkomponenten, die zusammenarbeiten, um einen sicheren und immer aktiven Assistenten zu ermöglichen. NVIDIA OpenShell fungiert als Sicherheitslaufzeit und Gateway. Es erzwingt Sandbox-Richtlinien, verwaltet Berechtigungsnachweise und proxyt Netzwerkaufrufe, um ein geschlossenes Ökosystem zu schaffen, in dem sensible Informationen nicht ungeschützt bleiben. Innerhalb dieser Sandbox läuft OpenClaw, ein Agenten-Framework, das die Verbindung zu Messaging-Plattformen wie Telegram oder Slack herstellt und Speicher sowie Werkzeugintegrationen verwaltet. Als „Gehirn" dient das 120-Milliarden-Parameter-Modell NVIDIA Nemotron 3 Super, das für hohe Befolgungsgenauigkeit und mehrstufige logische Schlüsse optimiert ist. Die Modell-Inferenz wird lokal über Ollama oder NVIDIA NIM auf einer GPU wie der DGX Spark durchgeführt, wodurch sichergestellt wird, dass keine Daten das Gerät verlassen. Die Implementierung auf einem NVIDIA DGX Spark-Gerät erfordert einige Konfigurationsschritte, die jedoch in etwa 20 bis 30 Minuten durchgeführt werden können. Zunächst müssen die Docker-Runtimes für GPU-Beschleunigung und die cgroup-Namespace-Einstellungen für die richtige Isolierung konfiguriert werden. Anschließend wird Ollama installiert und so konfiguriert, dass es von außerhalb des Sandboxes erreichbar ist, damit der Agent auf das Modell zugreifen kann. Das große Modell Nemotron 3 Super wird heruntergeladen und in den Arbeitsspeicher geladen, um Verzögerungen beim ersten Start zu vermeiden. Mit diesen Grundlagen installiert NemoClaw die gesamte Infrastruktur, einschließlich des Installations-Assistenten, der den Benutzern hilft, Sandbox-Namen, den Inferenz-Anbieter und Sicherheitsrichtlinien zu definieren. Ein zentrales Feature ist die Integration in Telegram. Nach der Einrichtung kann der Nutzer einen Bot über @BotFather erstellen und diesen Token in der Sandbox konfigurieren. Der Agent antwortet dann direkt auf Nachrichten aus dem Telegram-Client, wobei die Antwortzeit aufgrund der Größe des Modells zwischen 30 und 90 Sekunden liegen kann. Für den Fernzugriff über das Web-Interface ist eine SSH-Tunnel-Konfiguration erforderlich, um den lokalen Port sicher von einem anderen Gerät aus anzuzeigen. Ein weiterer wichtiger Aspekt ist das Sicherheitsmanagement. Standardmäßig blockiert OpenShell Anfragen nach außen, etwa wenn der Agent versuchen sollte, eine Webseite aufzurufen. Über eine grafische Benutzeroberfläche des Gateways kann der Administrator diese Anfragen in Echtzeit sehen und genehmigen oder ablehnen. Dies bietet eine Transparenz und Kontrolle, ohne dass die zugrunde liegenden Sicherheitsrichtlinien dauerhaft geändert werden müssen. Die Installation ist vollständig lokal und erfordert keine externen Cloud-Dienste während des Betriebs, was die Datenhoheit vollständig beim Nutzer behält. Für die Verwaltung stehen Befehle wie nemoclaw status, nemoclaw logs und nemoclaw list zur Verfügung. Sollte eine Entfernung erforderlich sein, bietet NemoClaw ein dediziertes Skript zur sauberen Deinstallation. Mit dieser Lösung demonstriert NVIDIA einen praktikablen Weg, hoch entwickelte KI-Agenten sicher und kontrolliert in eigenen Rechenzentren oder auf lokalen Workstations zu betreiben.
