Anthropic führt schnelle Iterationen von Opus 4.8 durch und stärkt die „Selbstkorrektur"-Fähigkeit
Am Donnerstag veröffentlichte Anthropic offiziell das derzeit fortschrittlichste öffentliche Modell „Opus 4.8" zu den Standardpreisen. Dieser Release erfolgte nur 41 Tage nach der Einführung von Version „Opus 4.7" und stellte damit einen neuen Iterationsrekord für Anthropic auf (währenddessen waren die Modelle „Sonnet" bzw. „Haiku" bereits drei beziehungsweise sieben Monate im Einsatz). Branchenbeobachter gehen davon aus, dass diese außergewöhnliche Geschwindigkeit bei Produktneuheiten teilweise auf eine kühle Reaktion des Marktes gegenüber den Leistungen von „Opus 4.7" sowie auf zunehmenden Wettbewerbsdruck durch OpenAI („Codex") und Google („Gemini Flash") zurückzuführen ist. Im Gegensatz zu früheren Releases liegt der Schwerpunkt von „Opus 4.8" nicht allein in Spitzenwerten bei Benchmark-Tests, sondern insbesondere in seiner präzisen Handhabung von „Unsicherheit". Frühe Tests von Anthropic zeigten, dass das neue Modell eher dazu neigt, Unsicherheiten in seinen Analysen aktiv zu kennzeichnen, als unbegründete Behauptungen aufzustellen. Rückmeldungen von Bridgewater Associates bestätigten dies: Nutzer stellten fest, dass „Opus 4.8" potenzielle Probleme sowohl in Eingaben als auch in Ausgaben proaktiv identifiziert und so effektiv die Schwachstelle anderer Modelle kompensiert, die häufig blinde Flecken übersehen. Zudem führte Anthropic gleichzeitig dynamische Arbeitsabläufe (Dynamic Workflows) ein, die sich aktuell noch in einer Forschungs-Vorschau befinden und speziell zur Verwaltung komplexer Aufgaben konzipiert wurden, die mehrere hundert parallele Agenten betreffen. Offizielle Beispiele zeigen, dass Claude Code in Kombination mit „Opus 4.8" nun eigenständig Migrationen großer Codebasen mit bis zu 100.000 Zeilen Code durchführen kann – vollständig automatisiert vom Start bis zum Merge. Das hochangesehene Top-Modell „Mythos" befindet sich weiterhin aufgrund von Bedenken hinsichtlich der Cybersicherheit in einem eingeschränkten Vorschau-Zustand. In der Ankündigung deutete Anthropic jedoch an, dass diese Einschränkung bald aufgehoben wird: „Wir arbeiten schnell daran, entsprechende Sicherheitsmaßnahmen zu vervollständigen und rechnen damit, innerhalb weniger Wochen bereit zu sein, ‚Mythos'-Level-Modelle allen Nutzern zugänglich zu machen."
