HyperAIHyperAI
Back to Headlines

Anthropic stellt Claude Sonnet 4.5 vor mit 30-Stunden-Kodierleistung

vor 5 Tagen

Am 29. September 2025 veröffentlichte Anthropic die neue Version Claude Sonnet 4.5 und kündigte sie als weltweit beste KI-Code-Plattform an. Der CEO Dario Amodei und das Team positionieren das Modell als Sprung vorwärts in der angewandten Künstlichen Intelligenz, insbesondere im Bereich Softwareentwicklung. Innerhalb von nur vier Monaten nach dem Release von Sonnet 4 unterstreicht dies die rasche Produktentwicklung im Wettlauf um generative KI. Anthropic betont, dass Sonnet 4.5 herausragende Ergebnisse bei SWE-Bench Verified erzielt – einem Standard zur Bewertung echter Software-Ingenieurleistungen – mit einem Score von 77,2 Prozent. Mit paralleler Testzeitrechnung (parallel test-time compute) steigt die Leistung sogar auf 82 Prozent. Im Vergleich erreichte OpenAIs GPT-5 Codex 74,5 Prozent, Google’s Gemini 2.5 Pro nur 67,2 Prozent. Neben den hervorragenden Benchmarks zeigt Sonnet 4.5 erhebliche Fortschritte in der praktischen Anwendung. In der OSWorld-Testsuite, die die Fähigkeit von KI zur Interaktion mit echten Desktop-Umgebungen prüft, erreicht das Modell 61,4 Prozent – ein deutlicher Anstieg gegenüber dem 42,2 Prozent von Sonnet 4. Auch im Terminal-Bench-Test, der Befehlszeilenoperationen bewertet, liegt Sonnet 4.5 mit 50 Prozent klar vor GPT-5 (43,8 Prozent). Besonders bemerkenswert ist die Stabilität bei langen, komplexen Aufgaben: Intern und bei frühen Kunden konnte das Modell über 30 Stunden kontinuierlich arbeiten. Ein Beispiel: Es baute eine Slack-ähnliche Chat-Anwendung mit rund 11.000 Codezeilen, inklusive Datenbank, Domain-Registrierung und Sicherheitsaudits. Anthropic hebt hervor, dass Sonnet 4.5 nicht nur Prototypen erstellt, sondern „produktionsreife“ Anwendungen generiert – ein entscheidender Sprung hin zu echter industrieller Nutzung. Der Chefproduktmanager Mike Krieger betont, dass das Modell trotz kleinerer Größe als Opus 4.1 in fast allen Leistungsaspekten überlegen ist. Der Joint-CEO Jared Kaplan beschreibt die Interaktion als „wie mit einem fähigen Kollegen“ zusammenzuarbeiten. Zur Unterstützung dieser Fähigkeiten kündigte Anthropic eine Reihe neuer Entwicklerwerkzeuge an. Dazu gehört der offizielle Claude Agent SDK, der Entwicklern ermöglicht, kontextbewusste KI-Agenten mit Funktionen wie Langzeitgedächtnis, Koordination zwischen Sub-Agenten und sichere Autorisierung zu bauen. Zudem wurde Claude Code auf Version 2.0 aktualisiert mit Features wie Checkpoints, die es erlauben, bei Fehlern einfach auf einen vorherigen Zustand zurückzukehren. Eine native VS Code-Erweiterung und verbesserte Terminal-Workflows sollen die tägliche Entwicklung erleichtern. Die Geschäftsstrategie von Anthropic wandelt sich von „Model-as-a-Service“ hin zu „Platform-as-a-Service“. Die Einnahmen aus Claude Code stiegen auf über 500 Millionen US-Dollar pro Jahr, wobei die Nutzung in drei Monaten mehr als zehnfach anstieg. Die Preise für Sonnet 4.5 bleiben bei 3 Dollar pro Million Eingabetausend und 15 Dollar pro Million Ausgabetausend – deutlich günstiger als Opus, aber teurer als GPT-5. Sicherheit bleibt ein Schwerpunkt. Anthropic betont, dass Sonnet 4.5 das „am besten ausgerichtete“ Modell sei, mit verbessertem Schutz vor Manipulationen und Prompt-Injektion. Trotzdem gelang es einem Prominenten wie Pliny the Liberator, die Sicherheitsbarrieren innerhalb weniger Minuten zu umgehen. Obwohl die Fehlalarmrate um das Zehnfache gesenkt wurde, bleiben gelegentliche Unterbrechungen der Gespräche ein Problem. Zusammenfassend zeigt Anthropic mit Sonnet 4.5 nicht nur technologische Überlegenheit im Code-Generieren, sondern auch eine klare Vision: KI nicht nur als Modell, sondern als vollständige Plattform für produktive, zuverlässige und sicherheitsbewusste Entwicklung. In einem sich schnell verändernden Markt bleibt die Fähigkeit, Leistung in praktische, benutzerfreundliche Tools zu übersetzen, entscheidend – und hier setzt Anthropic an.

Related Links