HyperAIHyperAI

Command Palette

Search for a command to run...

GPT-5 Est Sorti, Sam Altman : C'est Comme Parler À Un Expert En Doctorat, Avec Des Améliorations Clés Pour La Programmation, l'écriture Et La santé.

Featured Image

« GPT-3 donne l'impression de parler à un lycéen, GPT-4 donne l'impression de parler à un étudiant et GPT-5 donne l'impression de parler à un expert de niveau doctorat. »Lors de la conférence de presse qui vient de s'achever, Sam Altman a fait l'éloge de GPT-5 dans son discours d'ouverture : GPT-5 est « le modèle le plus puissant au monde pour la programmation et l'écriture ».

Construire un système unifié

GPT-5 est un système unifié qui comprend un modèle intelligent et efficace pour répondre à la plupart des questions (GPT-5-main).un modèle de raisonnement profond (GPT-5-thinking) pour résoudre des problèmes plus complexes,Un routeur temps réel détermine rapidement le modèle à utiliser en fonction du type de conversation, de la complexité de la question, des outils requis et de l'intention exprimée par l'utilisateur. Il est continuellement entraîné à l'aide de signaux réels, notamment le comportement de l'utilisateur, ses changements de modèle, ses préférences de réponse et l'évaluation de la précision des réponses, ce qui permet une optimisation continue.

Selon leurs documents officiels, les modèles de raisonnement, notamment gpt-5-thinking, gpt-5-thinking-mini et gpt-5-thinking-nano, sont entraînés par apprentissage par renforcement afin d'améliorer leurs capacités de raisonnement. Ces modèles « réfléchissent » avant de répondre aux questions et génèrent toute une chaîne de pensée interne avant de répondre aux utilisateurs. Grâce à l'entraînement,Ces modèles ont appris à optimiser leurs processus de réflexion, à essayer différentes stratégies et à reconnaître leurs propres erreurs.

Selon l’évaluation d’OpenAI, GPT-5 (avec le mode de raisonnement activé) est plus performant qu’OpenAI o3 dans des capacités telles que le raisonnement visuel, le codage d’agent et la résolution de problèmes scientifiques de niveau universitaire.Et le nombre de jetons de sortie est passé de 50% à 80%.

Parallèlement, dans le test polyglotte Aider qui évalue la capacité de codage,GPT‑5 bat le record avec un score de 88%.Son taux d’erreur est réduit de deux tiers par rapport à o3.

GPT-5 surpasse également les normes actuelles dans de nombreux domaines, avec notamment un score de 94,61 TP3T au test AIME 2025, de 74,91 TP3T à la tâche de codage en situation réelle SWE-bench Verified et de 84,21 TP3T au MMMU. Grâce aux capacités de raisonnement améliorées de GPT-5 Pro, le modèle a également obtenu un score de 88,41 TP3T à la tâche GPQA (General Purpose Question Answering), atteignant ainsi les normes actuelles.

Se concentrer sur l’amélioration de trois scénarios majeurs : l’écriture, la programmation et la consultation en santé

Il est rapporté que les trois scénarios d'application les plus courants d'OpenAI dans ChatGPT sont :Écriture, programmation et santé.Les performances de GPT-5 ont été encore améliorées.

OpenAI a proposé,GPT‑5 est son modèle de programmation le plus puissant à ce jour.Il a permis des améliorations significatives dans la génération front-end complexe et le débogage de bases de code volumineuses : une seule invite permet de générer des sites web, des applications et des jeux attrayants et réactifs, faisant preuve d'une grande sensibilité esthétique. De plus, GPT‑5 excelle dans l'analyse approfondie des bases de code, répondant avec précision aux questions sur les mécanismes opérationnels des modules de code et leur interopérabilité.

En plus de la programmation, GPT‑5 fonctionne également très bien dans diverses tâches d'agent, établissant de nouveaux records dans les benchmarks de suivi d'instructions (avec un score de 69,6% sur Scale MultiChallenge) et d'appel d'outils (avec un score de 96,7% sur τ(2)-bench telecom).

Dans les benchmarks LongFact et FactScore,Le taux d’erreur factuel de GPT-5 est environ 80% inférieur à celui de o3.Cela rend GPT-5 particulièrement adapté aux scénarios de tâches d'agent avec des exigences d'exactitude élevées, en particulier dans des domaines clés tels que la génération de code, le traitement des données et l'aide à la décision.

En matière d'écriture créative, le GPT-5 permet de créer des textes riches en profondeur, en rythme et en résonance littéraires. Il est plus fiable pour traiter des tâches d'écriture structurellement ambiguës, comme le maintien de la cohérence du mètre iambique, et permet d'obtenir une expression claire et puissante tout en respectant la forme stylistique, offrant ainsi une écriture plus réaliste dans des situations telles que la rédaction de rapports de perfectionnement, d'e-mails et de notes de service.

Il convient de mentionner quePour contrôler la longueur par défaut des réponses GPT-5, OpenAI a également ajouté un nouveau paramètre d’API Verbosity.Ce paramètre prend en charge trois valeurs facultatives : faible, moyen et élevé. Si une instruction explicite entre en conflit avec un paramètre redondant, l'instruction explicite prévaut. Par exemple, si un utilisateur demande à GPT-5 de « rédiger une dissertation de cinq paragraphes », la réponse du modèle doit toujours contenir cinq paragraphes.

Sur les questions liées à la santé,GPT-5 a atteint un score record de 46,2% dans le benchmark HealthBench.Il peut identifier de manière proactive les problèmes de santé potentiels et fournir des recommandations précises en fonction des connaissances de base et de la situation géographique de l'utilisateur.

OpenAI a réalisé de nombreuses avancées récemment. L'entreprise vient de se positionner comme SOTA dans le secteur open source avec gpt-oss, et vient de lancer le très attendu GPT-5. La sortie simultanée de plusieurs produits démontre sa puissance technologique. Cependant, compte tenu des performances et de la sécurité du modèle, il est préférable de patienter un peu et d'attendre les tests sur le marché.

Références :

1.https://www.theverge.com/openai/748017/gpt-5-chatgpt-openai-release

2.https://cdn.openai.com/pdf/8124a3ce-ab78-4f06-96eb-49ea29ffb52f/gpt5-system-card-aug7.pdf