KI-Agent entwickeln und in der Cloud bereitstellen
Amazon Web Services erweitert sein Ökosystem für KI-Agenten mit der Einführung von Strands und dem verwalteten Dienst Amazon Bedrock AgentCore. Die neue Architektur trennt klar zwischen der Anwendungslogik eines Agenten und seiner betrieblichen Infrastruktur. Während Strands als quelloffenes Framework die Definition von Modellauswahl, Systemprompten, Werkzeugintegrationen und Gesprächskontext übernimmt, stellt AgentCore die cloudnative Laufzeitumgebung, Skalierung, Sicherheit und langlebige Speicherkapazitäten bereit. Der Ansatz ermöglicht Entwicklern, Agenten lokal zu prototypisieren und nahtlos in die AWS-Cloud zu migrieren. AgentCore ist frameworkunabhängig und unterstützt neben Strands auch andere SDKs. Der Kern des Systems liegt in der modular aufgebauten Infrastruktur: Die Runtime sorgt für sessionisierte Ausführungen, das Gateway verwaltet Tool-APIs, die Identity- und Policy-Komponenten regeln Zugriffsrechte via Cedar, und Observability-Tools übertragen Logs an CloudWatch und X-Ray. Ein praktisches Anwendungsbeispiel demonstriert die Funktionsweise anhand eines Wissensvermittlungs-Agenten, der Fragen in Mathematik, Physik, Chemie und Geographie beantwortet. Statt starrer Klassifikatoren nutzt das System den integrierten Sprachmodell-Routing, das die Domäne dynamisch erkennt. Die Anforderungsprüfung und Fehlerbehandlung finden auf Runtime-Ebene statt, bevor das Prompt an das zugrunde liegende Modell, etwa Anthropic Claude via Amazon Bedrock, geleitet wird. Eine zentrale Erweiterung stellt AgentCore Memory dar. Im Gegensatz zu reinen Session-IDs, die nur den Kontext einer einzelnen Konversation halten, extrahiert das Memory-Modul persistente Nutzerpräferenzen, Fakten oder Zusammenfassungen über mehrere Sitzungen hinweg. Durch die Zuweisung einer stabilen Actor-ID können Agenten individuelle Einstellungen wie Antwortstil oder Fachniveau langfristig abrufen, ohne diese bei jeder Anfrage erneut übermitteln zu müssen. Die Bereitstellung erfolgt über eine CLI-basierte Arbeitsumgebung, die automatisch CloudFormation-Stapel generiert, IAM-Rollen konfiguriert und das Anwendungscode-Paket im CodeZip-Format bereitstellt. Damit entfällt der manuelle Umgang mit Containern oder Orchestratoren für Standard-Workloads. Die Kostenstruktur bleibt transparent: Neben den variablen Inferenzkosten des gewählten Sprachmodells fallen nutzungsbasierte Gebühren für die Inanspruchnahme von Runtime- und Memory-Komponenten an. Mit dieser Architektur positioniert sich AWS als Plattformanbieter, der die Komplexität des Agenten-Managements reduziert und gleichzeitig Entwicklern volle Kontrolle über Modellwahl, Prompt-Design und Sicherheitsrichtlinien lässt. Die Integration in bestehende AWS-Dienste sowie die Unterstützung mehrerer KI-Provider macht Strands und AgentCore zu einer skalierbaren Basis für unternehmenskritische KI-Anwendungen.
