GPT-5 Est Sorti, Sam Altman : C'est Comme Parler À Un Expert En Doctorat, Avec Des Améliorations Clés Pour La Programmation, l'écriture Et La santé.

il y a un an

« GPT-3 donne l'impression de parler à un lycéen, GPT-4 donne l'impression de parler à un étudiant et GPT-5 donne l'impression de parler à un expert de niveau doctorat. »Lors de la conférence de presse qui vient de s'achever, Sam Altman a fait l'éloge de GPT-5 dans son discours d'ouverture : GPT-5 est « le modèle le plus puissant au monde pour la programmation et l'écriture ».

Construire un système unifié

GPT-5 est un système unifié qui comprend un modèle intelligent et efficace pour répondre à la plupart des questions (GPT-5-main).un modèle de raisonnement profond (GPT-5-thinking) pour résoudre des problèmes plus complexes,Un routeur temps réel détermine rapidement le modèle à utiliser en fonction du type de conversation, de la complexité de la question, des outils requis et de l'intention exprimée par l'utilisateur. Il est continuellement entraîné à l'aide de signaux réels, notamment le comportement de l'utilisateur, ses changements de modèle, ses préférences de réponse et l'évaluation de la précision des réponses, ce qui permet une optimisation continue.

Selon leurs documents officiels, les modèles de raisonnement, notamment gpt-5-thinking, gpt-5-thinking-mini et gpt-5-thinking-nano, sont entraînés par apprentissage par renforcement afin d'améliorer leurs capacités de raisonnement. Ces modèles « réfléchissent » avant de répondre aux questions et génèrent toute une chaîne de pensée interne avant de répondre aux utilisateurs. Grâce à l'entraînement,Ces modèles ont appris à optimiser leurs processus de réflexion, à essayer différentes stratégies et à reconnaître leurs propres erreurs.

Selon l’évaluation d’OpenAI, GPT-5 (avec le mode de raisonnement activé) est plus performant qu’OpenAI o3 dans des capacités telles que le raisonnement visuel, le codage d’agent et la résolution de problèmes scientifiques de niveau universitaire.Et le nombre de jetons de sortie est passé de 50% à 80%.

Parallèlement, dans le test polyglotte Aider qui évalue la capacité de codage,GPT‑5 bat le record avec un score de 88%.Son taux d’erreur est réduit de deux tiers par rapport à o3.

GPT-5 surpasse également les normes actuelles dans de nombreux domaines, avec notamment un score de 94,61 TP3T au test AIME 2025, de 74,91 TP3T à la tâche de codage en situation réelle SWE-bench Verified et de 84,21 TP3T au MMMU. Grâce aux capacités de raisonnement améliorées de GPT-5 Pro, le modèle a également obtenu un score de 88,41 TP3T à la tâche GPQA (General Purpose Question Answering), atteignant ainsi les normes actuelles.

Se concentrer sur l’amélioration de trois scénarios majeurs : l’écriture, la programmation et la consultation en santé

Il est rapporté que les trois scénarios d'application les plus courants d'OpenAI dans ChatGPT sont :Écriture, programmation et santé.Les performances de GPT-5 ont été encore améliorées.

OpenAI a proposé,GPT‑5 est son modèle de programmation le plus puissant à ce jour.Il a permis des améliorations significatives dans la génération front-end complexe et le débogage de bases de code volumineuses : une seule invite permet de générer des sites web, des applications et des jeux attrayants et réactifs, faisant preuve d'une grande sensibilité esthétique. De plus, GPT‑5 excelle dans l'analyse approfondie des bases de code, répondant avec précision aux questions sur les mécanismes opérationnels des modules de code et leur interopérabilité.

En plus de la programmation, GPT‑5 fonctionne également très bien dans diverses tâches d'agent, établissant de nouveaux records dans les benchmarks de suivi d'instructions (avec un score de 69,6% sur Scale MultiChallenge) et d'appel d'outils (avec un score de 96,7% sur τ(2)-bench telecom).

Dans les benchmarks LongFact et FactScore,Le taux d’erreur factuel de GPT-5 est environ 80% inférieur à celui de o3.Cela rend GPT-5 particulièrement adapté aux scénarios de tâches d'agent avec des exigences d'exactitude élevées, en particulier dans des domaines clés tels que la génération de code, le traitement des données et l'aide à la décision.

En matière d'écriture créative, le GPT-5 permet de créer des textes riches en profondeur, en rythme et en résonance littéraires. Il est plus fiable pour traiter des tâches d'écriture structurellement ambiguës, comme le maintien de la cohérence du mètre iambique, et permet d'obtenir une expression claire et puissante tout en respectant la forme stylistique, offrant ainsi une écriture plus réaliste dans des situations telles que la rédaction de rapports de perfectionnement, d'e-mails et de notes de service.

Il convient de mentionner quePour contrôler la longueur par défaut des réponses GPT-5, OpenAI a également ajouté un nouveau paramètre d’API Verbosity.Ce paramètre prend en charge trois valeurs facultatives : faible, moyen et élevé. Si une instruction explicite entre en conflit avec un paramètre redondant, l'instruction explicite prévaut. Par exemple, si un utilisateur demande à GPT-5 de « rédiger une dissertation de cinq paragraphes », la réponse du modèle doit toujours contenir cinq paragraphes.

Sur les questions liées à la santé,GPT-5 a atteint un score record de 46,2% dans le benchmark HealthBench.Il peut identifier de manière proactive les problèmes de santé potentiels et fournir des recommandations précises en fonction des connaissances de base et de la situation géographique de l'utilisateur.

OpenAI a réalisé de nombreuses avancées récemment. L'entreprise vient de se positionner comme SOTA dans le secteur open source avec gpt-oss, et vient de lancer le très attendu GPT-5. La sortie simultanée de plusieurs produits démontre sa puissance technologique. Cependant, compte tenu des performances et de la sécurité du modèle, il est préférable de patienter un peu et d'attendre les tests sur le marché.

Références :

1.https://www.theverge.com/openai/748017/gpt-5-chatgpt-openai-release

2.https://cdn.openai.com/pdf/8124a3ce-ab78-4f06-96eb-49ea29ffb52f/gpt5-system-card-aug7.pdf

Associé Actualités

OpenAI Lance GeneBench-Pro, Un Outil Qui Évalue Les Capacités De Recherche En IA À Travers 129 Questions Et 10 domaines.

Tutoriel Gratuit En Ligne Sur Les Processeurs | Agent Hermes : Apprendre La Mémoire À Long Terme ? Le Plugin D’amélioration De La Mémoire TencentDB Agent Memory Peut Stocker Séparément Les Faits, Les Préférences, Les États Des Tâches, etc.

Rapport Hebdomadaire Sur l'IA | Microsoft MAI-Thinking Explore l'auto-évolution De l'apprentissage Par Renforcement Pur, Atteignant Une Précision AIME De 97% ; VLM³ Réalise La Généralisation De Tâches 3D À Partir De Coordonnées Textuelles Simples, Sans Modification Architecturale… Un Aperçu Rapide Des Articles De Pointe En IA De La Semaine

Compilation De Jeux De Données | Jeux De Données d'évaluation d'agents d'IA : 10 Jeux De Données Publiés Par Microsoft, l'Université De Pékin, l'Université De Hong Kong, l'Université Jiao Tong De Shanghai, etc., Couvrant Tout, De La Mémoire À Longue Portée À l'exécution De Tâches Du Monde réel.

Résumé Du Tutoriel | Les Petits Modèles Open Source Atteignent Une Intelligence Globale Comparable À GPT-5 ; Évaluation Unique Des Modèles Populaires Tels Que Qwen 3.5/Gemma 4.

Tutoriel En Ligne | Guide Approfondi Sur Le Suivi d'instructions/l'inférence/la Programmation : Mistral Medium 3.5 Déploie Des Agents De Programmation Dans Le Cloud

L'utilisation Des Jetons a Diminué De 30%. Eywa, Un Cadre d'agent Intelligent Hétérogène Inspiré d'"Avatar", Combine Efficacement Des Modèles De Langage Avec Des Modèles De Base Spécifiques Au domaine.

Révolution TTS Sans Échantillonnage ! Quelques Secondes D’audio De Référence Suffisent : OmniVoice Vous Permet De Cloner Facilement Des Centaines De Langues ; 17 Langues En Une Seule Fois : MDPbench Résout Le Problème Majeur De L’analyse Syntaxique Des Systèmes De Texte À Faibles ressources.

Un Modèle De Détection De Confidentialité Exécutable Localement : Privacy Filter Assure Un Filtrage Des Données Personnelles De Haute Qualité À Faible Coût ; Entièrement Open Source ! Compatible Avec L’ensemble De Données Structurées Transfermarkt Contenant Plus De 80 000 Matchs De football.

HyperAI

GPT-5 Est Sorti, Sam Altman : C'est Comme Parler À Un Expert En Doctorat, Avec Des Améliorations Clés Pour La Programmation, l'écriture Et La santé.

il y a un an

Information

Reasoning

Construire un système unifié

Parallèlement, dans le test polyglotte Aider qui évalue la capacité de codage,GPT‑5 bat le record avec un score de 88%.Son taux d’erreur est réduit de deux tiers par rapport à o3.

Se concentrer sur l’amélioration de trois scénarios majeurs : l’écriture, la programmation et la consultation en santé

Il est rapporté que les trois scénarios d'application les plus courants d'OpenAI dans ChatGPT sont :Écriture, programmation et santé.Les performances de GPT-5 ont été encore améliorées.

Références :

1.https://www.theverge.com/openai/748017/gpt-5-chatgpt-openai-release

2.https://cdn.openai.com/pdf/8124a3ce-ab78-4f06-96eb-49ea29ffb52f/gpt5-system-card-aug7.pdf

Associé Actualités

OpenAI Lance GeneBench-Pro, Un Outil Qui Évalue Les Capacités De Recherche En IA À Travers 129 Questions Et 10 domaines.

Tutoriel Gratuit En Ligne Sur Les Processeurs | Agent Hermes : Apprendre La Mémoire À Long Terme ? Le Plugin D’amélioration De La Mémoire TencentDB Agent Memory Peut Stocker Séparément Les Faits, Les Préférences, Les États Des Tâches, etc.

Rapport Hebdomadaire Sur l'IA | Microsoft MAI-Thinking Explore l'auto-évolution De l'apprentissage Par Renforcement Pur, Atteignant Une Précision AIME De 97% ; VLM³ Réalise La Généralisation De Tâches 3D À Partir De Coordonnées Textuelles Simples, Sans Modification Architecturale… Un Aperçu Rapide Des Articles De Pointe En IA De La Semaine

Compilation De Jeux De Données | Jeux De Données d'évaluation d'agents d'IA : 10 Jeux De Données Publiés Par Microsoft, l'Université De Pékin, l'Université De Hong Kong, l'Université Jiao Tong De Shanghai, etc., Couvrant Tout, De La Mémoire À Longue Portée À l'exécution De Tâches Du Monde réel.

Résumé Du Tutoriel | Les Petits Modèles Open Source Atteignent Une Intelligence Globale Comparable À GPT-5 ; Évaluation Unique Des Modèles Populaires Tels Que Qwen 3.5/Gemma 4.

Tutoriel En Ligne | Guide Approfondi Sur Le Suivi d'instructions/l'inférence/la Programmation : Mistral Medium 3.5 Déploie Des Agents De Programmation Dans Le Cloud

L'utilisation Des Jetons a Diminué De 30%. Eywa, Un Cadre d'agent Intelligent Hétérogène Inspiré d'"Avatar", Combine Efficacement Des Modèles De Langage Avec Des Modèles De Base Spécifiques Au domaine.

Révolution TTS Sans Échantillonnage ! Quelques Secondes D’audio De Référence Suffisent : OmniVoice Vous Permet De Cloner Facilement Des Centaines De Langues ; 17 Langues En Une Seule Fois : MDPbench Résout Le Problème Majeur De L’analyse Syntaxique Des Systèmes De Texte À Faibles ressources.

Un Modèle De Détection De Confidentialité Exécutable Localement : Privacy Filter Assure Un Filtrage Des Données Personnelles De Haute Qualité À Faible Coût ; Entièrement Open Source ! Compatible Avec L’ensemble De Données Structurées Transfermarkt Contenant Plus De 80 000 Matchs De football.

Command Palette

GPT-5 Est Sorti, Sam Altman : C'est Comme Parler À Un Expert En Doctorat, Avec Des Améliorations Clés Pour La Programmation, l'écriture Et La santé.

Construire un système unifié

Se concentrer sur l’amélioration de trois scénarios majeurs : l’écriture, la programmation et la consultation en santé

Command Palette

GPT-5 Est Sorti, Sam Altman : C'est Comme Parler À Un Expert En Doctorat, Avec Des Améliorations Clés Pour La Programmation, l'écriture Et La santé.

Construire un système unifié

Se concentrer sur l’amélioration de trois scénarios majeurs : l’écriture, la programmation et la consultation en santé

Associé Actualités

OpenAI Lance GeneBench-Pro, Un Outil Qui Évalue Les Capacités De Recherche En IA À Travers 129 Questions Et 10 domaines.

Tutoriel Gratuit En Ligne Sur Les Processeurs | Agent Hermes : Apprendre La Mémoire À Long Terme ? Le Plugin D’amélioration De La Mémoire TencentDB Agent Memory Peut Stocker Séparément Les Faits, Les Préférences, Les États Des Tâches, etc.

Résumé Du Tutoriel | Les Petits Modèles Open Source Atteignent Une Intelligence Globale Comparable À GPT-5 ; Évaluation Unique Des Modèles Populaires Tels Que Qwen 3.5/Gemma 4.

Tutoriel En Ligne | Guide Approfondi Sur Le Suivi d'instructions/l'inférence/la Programmation : Mistral Medium 3.5 Déploie Des Agents De Programmation Dans Le Cloud

L'utilisation Des Jetons a Diminué De 30%. Eywa, Un Cadre d'agent Intelligent Hétérogène Inspiré d'"Avatar", Combine Efficacement Des Modèles De Langage Avec Des Modèles De Base Spécifiques Au domaine.

Command Palette

GPT-5 Est Sorti, Sam Altman : C'est Comme Parler À Un Expert En Doctorat, Avec Des Améliorations Clés Pour La Programmation, l'écriture Et La santé.

Construire un système unifié

Se concentrer sur l’amélioration de trois scénarios majeurs : l’écriture, la programmation et la consultation en santé

Associé Actualités

OpenAI Lance GeneBench-Pro, Un Outil Qui Évalue Les Capacités De Recherche En IA À Travers 129 Questions Et 10 domaines.

Tutoriel Gratuit En Ligne Sur Les Processeurs | Agent Hermes : Apprendre La Mémoire À Long Terme ? Le Plugin D’amélioration De La Mémoire TencentDB Agent Memory Peut Stocker Séparément Les Faits, Les Préférences, Les États Des Tâches, etc.

Résumé Du Tutoriel | Les Petits Modèles Open Source Atteignent Une Intelligence Globale Comparable À GPT-5 ; Évaluation Unique Des Modèles Populaires Tels Que Qwen 3.5/Gemma 4.

Tutoriel En Ligne | Guide Approfondi Sur Le Suivi d'instructions/l'inférence/la Programmation : Mistral Medium 3.5 Déploie Des Agents De Programmation Dans Le Cloud

L'utilisation Des Jetons a Diminué De 30%. Eywa, Un Cadre d'agent Intelligent Hétérogène Inspiré d'"Avatar", Combine Efficacement Des Modèles De Langage Avec Des Modèles De Base Spécifiques Au domaine.

Associé Actualités

OpenAI Lance GeneBench-Pro, Un Outil Qui Évalue Les Capacités De Recherche En IA À Travers 129 Questions Et 10 domaines.

Tutoriel Gratuit En Ligne Sur Les Processeurs | Agent Hermes : Apprendre La Mémoire À Long Terme ? Le Plugin D’amélioration De La Mémoire TencentDB Agent Memory Peut Stocker Séparément Les Faits, Les Préférences, Les États Des Tâches, etc.

Résumé Du Tutoriel | Les Petits Modèles Open Source Atteignent Une Intelligence Globale Comparable À GPT-5 ; Évaluation Unique Des Modèles Populaires Tels Que Qwen 3.5/Gemma 4.

Tutoriel En Ligne | Guide Approfondi Sur Le Suivi d'instructions/l'inférence/la Programmation : Mistral Medium 3.5 Déploie Des Agents De Programmation Dans Le Cloud

L'utilisation Des Jetons a Diminué De 30%. Eywa, Un Cadre d'agent Intelligent Hétérogène Inspiré d'"Avatar", Combine Efficacement Des Modèles De Langage Avec Des Modèles De Base Spécifiques Au domaine.

Associé Actualités

OpenAI Lance GeneBench-Pro, Un Outil Qui Évalue Les Capacités De Recherche En IA À Travers 129 Questions Et 10 domaines.

Tutoriel Gratuit En Ligne Sur Les Processeurs | Agent Hermes : Apprendre La Mémoire À Long Terme ? Le Plugin D’amélioration De La Mémoire TencentDB Agent Memory Peut Stocker Séparément Les Faits, Les Préférences, Les États Des Tâches, etc.

Résumé Du Tutoriel | Les Petits Modèles Open Source Atteignent Une Intelligence Globale Comparable À GPT-5 ; Évaluation Unique Des Modèles Populaires Tels Que Qwen 3.5/Gemma 4.

Tutoriel En Ligne | Guide Approfondi Sur Le Suivi d'instructions/l'inférence/la Programmation : Mistral Medium 3.5 Déploie Des Agents De Programmation Dans Le Cloud

L'utilisation Des Jetons a Diminué De 30%. Eywa, Un Cadre d'agent Intelligent Hétérogène Inspiré d'"Avatar", Combine Efficacement Des Modèles De Langage Avec Des Modèles De Base Spécifiques Au domaine.