Déploiement En Un Clic De gpt-oss-20b, Test De Modèles d'inférence Open Source Avec Des Performances De Pointe Proches De Celles De l'o3-mini

il y a 5 mois

Après 6 ans depuis GPT-2, OpenAI a finalement publié un autre grand modèle open source - en lançant gpt-oss-120b et gpt-oss-20b.Le premier, avec ses centaines de milliards de paramètres, est conçu pour les raisonnements complexes et les scénarios gourmands en connaissances. Le second est plus adapté aux applications verticales à faible latence, locales ou spécialisées, fonctionnant parfaitement sur du matériel grand public comme les ordinateurs portables et les périphériques. Cette double interprétation de « polyvalence des grands modèles » et de « professionnalité des petits modèles » offre une flexibilité de positionnement et de déploiement différenciée, répondant efficacement aux divers besoins des utilisateurs.

Sur le plan technique, gpt-oss utilise l'architecture MoE pour garantir des performances élevées tout en réduisant considérablement les besoins de calcul et de mémoire.Parmi eux, gpt-oss-120b peut fonctionner efficacement sur un seul GPU de 80 Go, tandis que gpt-oss-20b peut fonctionner sur des appareils de pointe avec seulement 16 Go de mémoire.

Dans les évaluations de tâches réelles, gpt-oss-120b a surpassé o3-mini dans Codeforces, MMLU, HLE et l'appel d'outil TauBench, et était à égalité ou même surpassé o4-mini.De plus, il surpasse o4-mini sur HealthBench⁠ et AIME 2024 et 2025. Malgré une taille de paramètre de modèle plus petite, gpt-oss-20b fonctionne presque aussi bien que o3-mini sur ces mêmes évaluations.

Afin de permettre à chacun de découvrir gpt-oss plus facilement,Le « déploiement Llama.cpp+open-webui de Gpt-oss-20b » est désormais disponible dans la section « Tutoriels » du site officiel d'HyperAI (hyper.ai).Commencez en un clic et découvrez les puissantes capacités du modèle SOTA open source basé sur une seule carte NVIDIA RTX 4090.

en outre,Le tutoriel pour gpt-oss-120b est également en cours de production et nous l'attendons avec impatience !

Lien du tutoriel :

https://go.hyper.ai/iEJvN

Essai de démonstration

1. Sur la page d'accueil hyper.ai, sélectionnez la page Tutoriels, choisissez Llama.cpp+open-webui pour déployer gpt-oss-20b, puis cliquez sur Exécuter ce tutoriel en ligne.

2. Une fois la page affichée, cliquez sur « Cloner » dans le coin supérieur droit pour cloner le didacticiel dans votre propre conteneur.

3. Sélectionnez les images « NVIDIA GeForce RTX 4090 » et « PyTorch », puis choisissez « Paiement à l'utilisation » ou « Forfait journalier/hebdomadaire/mensuel » selon vos besoins, puis cliquez sur « Continuer ». Les nouveaux utilisateurs peuvent s'inscrire via le lien d'invitation ci-dessous pour obtenir 4 heures de RTX 4090 et 5 heures de temps processeur gratuit !

Lien d'invitation exclusif HyperAI (copier et ouvrir dans le navigateur) :

https://openbayes.com/console/signup?r=Ada0322_NR0n

4. Attendez que les ressources soient allouées. Le premier clonage prendra environ 3 minutes. Lorsque le statut passe à « En cours d'exécution », cliquez sur la flèche à côté de « Adresse API » pour accéder à la page de démonstration. Veuillez noter que les utilisateurs doivent s'authentifier avec leur nom réel avant d'utiliser l'adresse API.

Démonstration d'effet

Après avoir accédé à la page d'exécution de la démonstration, entrez Prompt dans la boîte de dialogue et cliquez sur Exécuter.

L'auteur a effectué un test simple sur la création de contenu du modèle, la résolution de problèmes mathématiques et la capacité de raisonnement, et les réponses de gpt-oss étaient toutes assez bonnes.

Invite : Veuillez écrire un scénario comique sur les jeudis fous de KFC, environ 300 mots.

Invite : Quels sont les premier et deuxième chiffres après la virgule de (racine carrée de 2 + racine carrée de 3) à la puissance 2006 ?

Invite : Déterminez si la logique est correcte : Parce que le meurtrier n'est pas un routard et que vous n'êtes pas un routard, vous êtes le meurtrier.

Le tutoriel ci-dessus est celui recommandé par HyperAI cette fois-ci. Bienvenue à tous pour le découvrir !

Lien du tutoriel :

https://go.hyper.ai/iEJvN

Déploiement En Un Clic De gpt-oss-20b, Test De Modèles d'inférence Open Source Avec Des Performances De Pointe Proches De Celles De l'o3-mini

il y a 5 mois

Information

Intelligence Artificielle

Reasoning

en outre,Le tutoriel pour gpt-oss-120b est également en cours de production et nous l'attendons avec impatience !

Lien du tutoriel :

https://go.hyper.ai/iEJvN

Essai de démonstration

1. Sur la page d'accueil hyper.ai, sélectionnez la page Tutoriels, choisissez Llama.cpp+open-webui pour déployer gpt-oss-20b, puis cliquez sur Exécuter ce tutoriel en ligne.

2. Une fois la page affichée, cliquez sur « Cloner » dans le coin supérieur droit pour cloner le didacticiel dans votre propre conteneur.

Lien d'invitation exclusif HyperAI (copier et ouvrir dans le navigateur) :

https://openbayes.com/console/signup?r=Ada0322_NR0n

Démonstration d'effet

Après avoir accédé à la page d'exécution de la démonstration, entrez Prompt dans la boîte de dialogue et cliquez sur Exécuter.

Invite : Veuillez écrire un scénario comique sur les jeudis fous de KFC, environ 300 mots.

Invite : Quels sont les premier et deuxième chiffres après la virgule de (racine carrée de 2 + racine carrée de 3) à la puissance 2006 ?

Invite : Déterminez si la logique est correcte : Parce que le meurtrier n'est pas un routard et que vous n'êtes pas un routard, vous êtes le meurtrier.

Le tutoriel ci-dessus est celui recommandé par HyperAI cette fois-ci. Bienvenue à tous pour le découvrir !

Lien du tutoriel :

https://go.hyper.ai/iEJvN

Command Palette

Déploiement En Un Clic De gpt-oss-20b, Test De Modèles d'inférence Open Source Avec Des Performances De Pointe Proches De Celles De l'o3-mini

Essai de démonstration

Démonstration d'effet

Command Palette

Déploiement En Un Clic De gpt-oss-20b, Test De Modèles d'inférence Open Source Avec Des Performances De Pointe Proches De Celles De l'o3-mini

Essai de démonstration

Démonstration d'effet

Related News

GPT-5 Domine Tous Les Domaines ; OpenAI Lance FrontierScience, Utilisant Une Double Approche « inférence + Recherche » Pour Tester Les Capacités Des Modèles À Grande échelle.

Un Essai À Faible Barrière d'Open-AutoGLM : Une Expérience d'agent Intelligent Combinant La Compréhension De l'écran Et l'exécution Automatisée ; Spatial-SSRL-81k : Construction d'un Chemin d'amélioration Auto-supervisé Pour La Conscience spatiale.

L'Université Des Sciences Et Technologies De Hong Kong Et d'autres Ont Proposé Le Modèle De Prévision Météorologique Incrémental VA-MoE, Qui a Simplifié Les Paramètres Par 75% Et Atteint Toujours Les Performances SOTA.

Technologie d'entrée/sortie Innovante ! Tencent Hunyuan Lance HunyuanWorld-Mirror, Une Reconstruction 3D Révolutionnaire ; Découvrez l'intégralité Du Contenu Netflix ! Le Catalogue De Films Et Séries Netflix Offre Un Éclairage Précieux Sur Les Tendances Du divertissement.

Tutoriel En Ligne | SAM 3 Améliore La Segmentation Des Concepts Suggérés Avec Des Performances Doublées, Traitant 100 Objets De Détection En 30 Millisecondes

Tutoriel En Ligne | Superposition d'images Précise : Qwen-Image-Layered Surmonte Les Difficultés Liées À l'édition De Calques Cibles, Pour Une Fidélité Et Une Cohérence optimales.

Tutoriel En Ligne | FLUX.2, La Nouvelle Technologie De Pointe En Matière De Génération d'images, Permet De Référencer Simultanément 10 Images Pour Une Cohérence De caractères/styles Extrêmement élevée.

Command Palette

Déploiement En Un Clic De gpt-oss-20b, Test De Modèles d'inférence Open Source Avec Des Performances De Pointe Proches De Celles De l'o3-mini

Essai de démonstration

Démonstration d'effet

Related News

GPT-5 Domine Tous Les Domaines ; OpenAI Lance FrontierScience, Utilisant Une Double Approche « inférence + Recherche » Pour Tester Les Capacités Des Modèles À Grande échelle.

Un Essai À Faible Barrière d'Open-AutoGLM : Une Expérience d'agent Intelligent Combinant La Compréhension De l'écran Et l'exécution Automatisée ; Spatial-SSRL-81k : Construction d'un Chemin d'amélioration Auto-supervisé Pour La Conscience spatiale.

L'Université Des Sciences Et Technologies De Hong Kong Et d'autres Ont Proposé Le Modèle De Prévision Météorologique Incrémental VA-MoE, Qui a Simplifié Les Paramètres Par 75% Et Atteint Toujours Les Performances SOTA.

Technologie d'entrée/sortie Innovante ! Tencent Hunyuan Lance HunyuanWorld-Mirror, Une Reconstruction 3D Révolutionnaire ; Découvrez l'intégralité Du Contenu Netflix ! Le Catalogue De Films Et Séries Netflix Offre Un Éclairage Précieux Sur Les Tendances Du divertissement.

Tutoriel En Ligne | SAM 3 Améliore La Segmentation Des Concepts Suggérés Avec Des Performances Doublées, Traitant 100 Objets De Détection En 30 Millisecondes

Tutoriel En Ligne | Superposition d'images Précise : Qwen-Image-Layered Surmonte Les Difficultés Liées À l'édition De Calques Cibles, Pour Une Fidélité Et Une Cohérence optimales.

Tutoriel En Ligne | FLUX.2, La Nouvelle Technologie De Pointe En Matière De Génération d'images, Permet De Référencer Simultanément 10 Images Pour Une Cohérence De caractères/styles Extrêmement élevée.

Related News

GPT-5 Domine Tous Les Domaines ; OpenAI Lance FrontierScience, Utilisant Une Double Approche « inférence + Recherche » Pour Tester Les Capacités Des Modèles À Grande échelle.

Un Essai À Faible Barrière d'Open-AutoGLM : Une Expérience d'agent Intelligent Combinant La Compréhension De l'écran Et l'exécution Automatisée ; Spatial-SSRL-81k : Construction d'un Chemin d'amélioration Auto-supervisé Pour La Conscience spatiale.

L'Université Des Sciences Et Technologies De Hong Kong Et d'autres Ont Proposé Le Modèle De Prévision Météorologique Incrémental VA-MoE, Qui a Simplifié Les Paramètres Par 75% Et Atteint Toujours Les Performances SOTA.

Technologie d'entrée/sortie Innovante ! Tencent Hunyuan Lance HunyuanWorld-Mirror, Une Reconstruction 3D Révolutionnaire ; Découvrez l'intégralité Du Contenu Netflix ! Le Catalogue De Films Et Séries Netflix Offre Un Éclairage Précieux Sur Les Tendances Du divertissement.

Tutoriel En Ligne | SAM 3 Améliore La Segmentation Des Concepts Suggérés Avec Des Performances Doublées, Traitant 100 Objets De Détection En 30 Millisecondes

Tutoriel En Ligne | Superposition d'images Précise : Qwen-Image-Layered Surmonte Les Difficultés Liées À l'édition De Calques Cibles, Pour Une Fidélité Et Une Cohérence optimales.

Tutoriel En Ligne | FLUX.2, La Nouvelle Technologie De Pointe En Matière De Génération d'images, Permet De Référencer Simultanément 10 Images Pour Une Cohérence De caractères/styles Extrêmement élevée.

Related News

GPT-5 Domine Tous Les Domaines ; OpenAI Lance FrontierScience, Utilisant Une Double Approche « inférence + Recherche » Pour Tester Les Capacités Des Modèles À Grande échelle.

Un Essai À Faible Barrière d'Open-AutoGLM : Une Expérience d'agent Intelligent Combinant La Compréhension De l'écran Et l'exécution Automatisée ; Spatial-SSRL-81k : Construction d'un Chemin d'amélioration Auto-supervisé Pour La Conscience spatiale.

L'Université Des Sciences Et Technologies De Hong Kong Et d'autres Ont Proposé Le Modèle De Prévision Météorologique Incrémental VA-MoE, Qui a Simplifié Les Paramètres Par 75% Et Atteint Toujours Les Performances SOTA.

Technologie d'entrée/sortie Innovante ! Tencent Hunyuan Lance HunyuanWorld-Mirror, Une Reconstruction 3D Révolutionnaire ; Découvrez l'intégralité Du Contenu Netflix ! Le Catalogue De Films Et Séries Netflix Offre Un Éclairage Précieux Sur Les Tendances Du divertissement.

Tutoriel En Ligne | SAM 3 Améliore La Segmentation Des Concepts Suggérés Avec Des Performances Doublées, Traitant 100 Objets De Détection En 30 Millisecondes

Tutoriel En Ligne | Superposition d'images Précise : Qwen-Image-Layered Surmonte Les Difficultés Liées À l'édition De Calques Cibles, Pour Une Fidélité Et Une Cohérence optimales.

Tutoriel En Ligne | FLUX.2, La Nouvelle Technologie De Pointe En Matière De Génération d'images, Permet De Référencer Simultanément 10 Images Pour Une Cohérence De caractères/styles Extrêmement élevée.