Die Claude 3 Modellfamilie: Opus, Sonnet, Haiku

Wir stellen Claude 3 vor, eine neue Familie großer multimodaler Modelle – Claude 3 Opus, unsere leistungsstärkste Variante, Claude 3 Sonnet, die ein optimales Gleichgewicht aus Fähigkeiten und Geschwindigkeit bietet, sowie Claude 3 Haiku, unser schnellstes und kostengünstigstes Modell. Alle neuen Modelle verfügen über visuelle Fähigkeiten, die es ihnen ermöglichen, Bilddaten zu verarbeiten und zu analysieren. Die Claude-3-Familie zeigt herausragende Leistung bei Benchmark-Evaluierungen und setzt neue Maßstäbe hinsichtlich der Fähigkeiten in Denken, Mathematik und Programmierung. Claude 3 Opus erreicht state-of-the-art-Ergebnisse bei Bewertungen wie GPQA [1], MMLU [2], MMMU [3] und vielen weiteren. Claude 3 Haiku erzielt auf den meisten rein textbasierten Aufgaben Ergebnisse, die gleich gut oder besser sind als die von Claude 2 [4], während Sonnet und Opus diese deutlich übertreffen. Zudem zeigen diese Modelle eine verbesserte Flüssigkeit in nicht-englischen Sprachen, was sie für ein globales Publikum vielseitiger macht. In diesem Bericht bieten wir eine detaillierte Analyse unserer Evaluierungen mit Fokus auf zentrale Fähigkeiten, Sicherheit, gesellschaftliche Auswirkungen sowie die katastrophalen Risikobewertungen, die wir in unserer Richtlinie für verantwortungsvolles Skalieren zugesagt haben.