Command Palette
Search for a command to run...
GPT-4 Technischer Bericht
GPT-4 Technischer Bericht
OpenAI*
Zusammenfassung
Wir berichten über die Entwicklung von GPT-4, einem groß angelegten, multimodalen Modell, das Bild- und Texteingaben akzeptieren und Textausgaben erzeugen kann. Obwohl GPT-4 in vielen realen Szenarien weniger fähig als Menschen ist, zeigt es menschliche Leistungsniveaus bei verschiedenen professionellen und akademischen Benchmarks, einschließlich dem Bestehen eines simulierten Anwaltsprüfungs (bar exam) mit einer Punktzahl im oberen 10-Prozent-Bereich der Prüfungsteilnehmer. GPT-4 ist ein auf dem Transformer-Prinzip basierendes Modell, das vortrainiert wurde, um das nächste Token in einem Dokument vorherzusagen. Der nachfolgende Ausrichtungsprozess führt zu verbesserten Leistungen in Bezug auf Faktualität und Einhaltung des gewünschten Verhaltens. Ein wesentlicher Bestandteil dieses Projekts war die Entwicklung von Infrastruktur und Optimierungsmethoden, die sich über einen breiten Bereich von Skalierungen vorhersagbar verhalten. Dies ermöglichte es uns, einige Aspekte der Leistungsfähigkeit von GPT-4 auf Basis von Modellen vorherzusagen, die mit nicht mehr als 1/1000 des Rechenaufwands von GPT-4 trainiert wurden.