HyperAI
Back to Headlines

OpenAI lance son premier LLM à poids ouverts en cinq ans

il y a un jour

OpenAI a lancé mardi deux nouveaux modèles linguistiques à poids ouverts, gpt-oss-120b et gpt-oss-20b, disponibles gratuitement et personnalisables, marquant un tournant majeur dans sa stratégie après des années de fermeture. Ces modèles, conçus pour être exécutés localement sur des ordinateurs, même avec des ressources limitées — le plus petit pouvant fonctionner sur 16 Go de mémoire — représentent la première sortie de ce type depuis GPT-2 en 2019. Cette initiative répond à la pression croissante pour une plus grande transparence, notamment après les déclarations en janvier de Sam Altman, qui a reconnu que son entreprise avait été « du mauvais côté de l’histoire » en ne rendant pas ses modèles accessibles. L’objectif est clair : rattraper le retard face à des concurrents comme Meta, avec ses modèles Llama, ou le startup chinois DeepSeek, qui ont popularisé l’approche open-weight, permettant aux développeurs de modifier et d’optimiser les modèles selon leurs besoins. OpenAI, qui a toujours revendiqué une mission humaniste visant à faire bénéficier l’intelligence générale artificielle (AGI) à l’ensemble de l’humanité, a récemment révisé sa structure : le groupe conservera son statut de fondation, mais une entité à but lucratif, supervisée par le conseil de la fondation, pourra générer des profits. Ce changement a été motivé par des critiques de la part d’investisseurs, d’activistes de la sécurité de l’IA et même d’Elon Musk, qui avait intenté une poursuite contre OpenAI, estimant que le projet initial avait été trahi. Les modèles gpt-oss sont conçus pour des tâches avancées comme la recherche sur internet, l’écriture de code, le raisonnement complexe et l’exécution d’agents via les APIs existantes. Ils ont été rigoureusement testés pour éviter tout usage malveillant : OpenAI a filtré des données sensibles (chimiques, biologiques, nucléaires) durant l’entraînement, simulé des tentatives de manipulation par des acteurs malveillants et collaboré avec trois groupes externes pour évaluer les risques. Le processus de raisonnement du modèle (chain-of-thought) est visible, permettant de surveiller tout comportement suspect. Disponibles sous licence Apache 2.0 sur des plateformes comme Hugging Face, GitHub, Azure, AWS, et via des outils comme LM Studio ou Ollama, ces modèles peuvent être utilisés librement, y compris dans des applications commerciales. OpenAI a également collaboré avec des géants technologiques comme Nvidia, AMD, Cerebras et Groq pour garantir leur compatibilité avec diverses architectures matérielles. Selon Greg Brockman, co-fondateur d’OpenAI, cette sortie marque une volonté de stimuler l’innovation en abaissant les barrières d’accès. « Quand on laisse les gens expérimenter, ils font des choses incroyables », a-t-il affirmé. Bien que les performances ne soient pas comparées directement à celles de modèles comme Llama ou Gemma, OpenAI affirme que gpt-oss égale ses modèles fermés dans des tests de codage et de raisonnement, notamment sur des épreuves comme Humanity’s Last Exam. Ce lancement, long attendu, illustre une transformation stratégique d’OpenAI, qui cherche à concilier innovation, accessibilité et sécurité, tout en s’inscrivant dans un écosystème en pleine expansion autour des modèles ouverts.

Related Links