HyperAIHyperAI

Command Palette

Search for a command to run...

Anthroporas Claude wird ehrlicher bei Fehlern

Anthropic hat am Donnerstag den neuen KI-Modell Claude Opus 4.8 veröffentlicht und hebt dabei dessen erhöhte Ehrlichkeit als Hauptmerkmal hervor. Das Unternehmen trainiert seine Modelle grundsätzlich darauf, keine nicht belegbaren Behauptungen aufzustellen. Ein bekanntes Problem bei früheren KI-Systemen bestand darin, dass diese manchmal zu vorschnellen Schlüssen neigten und Fortschritte vorgetäuscht haben, selbst wenn die Beweislage dünn war. Nach Angaben von Anthropic zeigen frühe Testergebnisse, dass Opus 4.8 Unsicherheiten bei der Bearbeitung von Aufgaben häufiger selbst benennt und weniger dazu neigt, unbelegte Aussagen zu treffen. In internen Bewertungen ist das Modell etwa viermal seltener dafür bekannt, Fehler im von ihm geschriebenen Code unkommentiert zu übergehen, verglichen mit dem Vorgänger. Neben den Verbesserungen im Bereich der Zuverlässigkeit führt Anthropic eine neue Funktion ein, mit der Nutzer den Aufwand steuern können, den Claude in eine Aufgabe investiert. Nutzer können wählen, ob sie eine Antwort mit geringerem Aufwand erhalten, was weniger Rechenressourcen verbraucht und dabei hilft, Kontingentgrenzen schonender zu nutzen, oder eine Antwort mit höherem Aufwand für komplexere Anforderungen anfordern können. Zusätzlich bringt das Unternehmen eine Technologie namens dynamische Workflows in der Forschungs-Vorschau-Version auf den Markt. Diese Funktion ermöglicht es Claude, größere und komplexere Aufgaben zu übernehmen, indem es die Arbeit plant und dann hunderte paralleler Unteragenten innerhalb einer einzigen Sitzung ausführt. Bei Verwendung von Opus 4.8 können diese Agenten zudem längere Zeiten arbeiten. Nach Abschluss der Aufgaben führt das System eine Überprüfung der Ergebnisse durch, bevor es diese dem Nutzer meldet. Dieser Ansatz zielt darauf ab, die Leistungsfähigkeit bei großen Projekten zu steigern, während die Zuverlässigkeit der Ergebnisse durch die vorgeschaltete Verifikationsphase gesichert wird. Die Einführung dieser Modelle und Funktionen unterstreicht Anstricks Fokus darauf, nicht nur leistungsfähigere, sondern auch verlässlichere KI-Systeme zu entwickeln, die potenzielle Fehlerquellen proaktiv erkennen und kommunizieren.

Verwandte Links