HyperAI

Lors de sa grande diffusion en direct consacrée à GPT-5 jeudi, OpenAI a présenté plusieurs graphiques censés illustrer les performances impressionnantes du modèle. Mais une inspection attentive a révélé des erreurs flagrantes dans certaines visualisations. Dans l’un d’eux, censé montrer la capacité de GPT-5 à tromper les évaluations de déception entre modèles, l’échelle est manifestement déréglée. Par exemple, pour l’évaluation de la « déception en programmation », GPT-5 affiche un taux de 50,0 %, alors que le modèle plus ancien d’OpenAI, o3, obtient 47,4 % — pourtant, le barreau représentant o3 est plus long que celui de GPT-5. Dans un autre cas, un score de GPT-5 est inférieur à celui d’o3, mais est pourtant représenté par une barre plus grande. Sur le même graphique, les scores d’o3 et de GPT-4o sont distincts, mais affichés avec des barres de même taille, ce qui crée une impression trompeuse. Ces erreurs ont été si visibles que le PDG d’OpenAI, Sam Altman, a dû réagir publiquement, qualifiant le graphique de « gaffe monumentale ». Un membre de l’équipe marketing a également présenté ses excuses, qualifiant l’incident d’« infraction graphique involontaire ». OpenAI n’a pas immédiatement répondu à une demande de commentaire. Bien qu’il ne soit pas encore clair si GPT-5 a été utilisé pour concevoir ces graphiques, l’incident constitue un mauvais point pour la société lors de son lancement majeur. Ce moment délicat prend d’autant plus de poids que la société met en avant des progrès significatifs dans la réduction des hallucinations — une des principales faiblesses des modèles d’intelligence artificielle — avec la version GPT-5. Or, une présentation graphique erronée, même mineure, peut nuire à la crédibilité de ces affirmations, surtout devant un public attentif et critique. Ce contretemps rappelle que même les entreprises leaders dans l’IA doivent faire preuve de rigueur dans la communication de leurs résultats.

OpenAI se met en difficulté avec des graphiques biaisés durant le lancement de GPT-5

Related Links