Command Palette
Search for a command to run...
Rapport technique sur GPT-4
Rapport technique sur GPT-4
OpenAI*
Résumé
Nous rapportons le développement de GPT-4, un modèle à grande échelle et multimodal capable d'accepter des entrées d'images et de texte, et de produire des sorties textuelles. Bien que moins performant que les humains dans de nombreuses situations réelles, GPT-4 montre des performances au niveau humain sur diverses évaluations professionnelles et académiques, notamment en réussissant un examen du barreau simulé avec un score se situant dans le top 10% des candidats. GPT-4 est un modèle basé sur l'architecture Transformer, pré-entraîné pour prédire le prochain jeton (token) dans un document. Le processus d'alignement post-entraînement aboutit à une amélioration des performances en termes de véracité et d'adhésion au comportement souhaité. Un élément central de ce projet a été le développement d'infrastructures et de méthodes d'optimisation qui se comportent de manière prévisible sur une large gamme d'échelles. Cela nous a permis de prédire avec précision certains aspects des performances de GPT-4 en nous appuyant sur des modèles entraînés avec moins de 1/1000e des ressources informatiques utilisées pour GPT-4.