NVIDIA AI-Q-Blueprint auf OCI bereitstellen
NVIDIA und Oracle haben gemeinsam ein Produktions-ready Blueprint für die Bereitstellung von KI-Agentensystemen auf der Oracle Cloud Infrastructure (OCI) vorgestellt. Im Mittelpunkt steht NVIDIA AI-Q 2.0, eine offene Referenzarchitektur für mehrstufige KI-Agenten, die auf LangChain Deep Agents und dem NVIDIA NeMo Agent Toolkit basiert. Die Lösung ermöglicht die Verarbeitung komplexer Anfragen durch getrennte Forschungswege: Ein Intent-Router leitet einfache Abfragen an einen schnellen Shallow Research Agent weiter, während umfangreiche Recherchen von einem Deep Agent mit Planning- und Researcher-Subagenten bearbeitet werden. Alle Komponenten arbeiten in sicher abgeschotteten Sandboxes und nutzen ein gemeinsames Dateisystem sowie erweiterbare RAG-Backends. Für die Implementierung auf OCI setzt das Blueprint auf eine strikte Trennung von Infrastruktur und Anwendungslogik. Mittels Terraform werden innerhalb von etwa zwanzig bis fünfundzwanzig Minuten sämtliche erforderlichen Cloud-Ressourcen provisioniert, darunter ein VCN mit Subnetzen, ein OKE-Cluster mit enhanced Nodes, ein OCI Load Balancer für den HTTP-Eingang sowie ein OCI Vault zur verschlüsselten Ablage von API-Schlüsseln. Die eigentliche Anwendung wird anschließend über ein Helm-Chart bereitgestellt, das den KI-Backend-Dienst, eine Frontend-Oberfläche und eine PostgreSQL-Datenbank im Kubernetes-Cluster installiert. Alle Container-Images und Konfigurationen stammen direkt aus der NVIDIA GPU Cloud, wodurch lokale Build-Prozesse entfallen. Der Bereitstellungsablauf ist vollständig skriptbasiert und richtet sich an Entwickler sowie Plattformingenieure mit Erfahrung in Kubernetes, Terraform und der Shell. Nach der Konfiguration der Terraform-Variablen und dem Export der erforderlichen API-Schlüssel wird der Cluster initialisiert und das Helm-Chart deployed. Ein abschließender Aufruf der Load-Balancer-Adresse im Browser stellt die voll funktionsfähige KI-Schnittstelle bereit. Bei Bedarf kann die gesamte Umgebung reproduzierbar und ohne zurückgelassene Ressourcen mit einem einzelnen Terraform-Befehl entfernt werden. Die Verfügbarkeit des Blueprints markiert einen deutlichen Schritt hin zur standardisierten, betriebssicheren Nutzung mehrstufiger KI-Agenten im Unternehmensumfeld. Durch die Modularität der Architektur können Modelle, Werkzeuge und Bewertungsframeworks einfach ausgetauscht werden, was eine flexible Anpassung an spezifische Forschungs- und Analyseanforderungen ermöglicht. Entwickler können die Umsetzung auf dem NVIDIA Developer Forum diskutieren und ihre individuellen Anpassungen teilen, wodurch ein wiederverwendbarer Standard für Cloud-basierte KI-Agenten-Workloads etabliert wird.
