Déploiement En Un Clic De gpt-oss-20b, Test De Modèles d'inférence Open Source Avec Des Performances De Pointe Proches De Celles De l'o3-mini

Après 6 ans depuis GPT-2, OpenAI a finalement publié un autre grand modèle open source - en lançant gpt-oss-120b et gpt-oss-20b.Le premier, avec ses centaines de milliards de paramètres, est conçu pour les raisonnements complexes et les scénarios gourmands en connaissances. Le second est plus adapté aux applications verticales à faible latence, locales ou spécialisées, fonctionnant parfaitement sur du matériel grand public comme les ordinateurs portables et les périphériques. Cette double interprétation de « polyvalence des grands modèles » et de « professionnalité des petits modèles » offre une flexibilité de positionnement et de déploiement différenciée, répondant efficacement aux divers besoins des utilisateurs.
Sur le plan technique, gpt-oss utilise l'architecture MoE pour garantir des performances élevées tout en réduisant considérablement les besoins de calcul et de mémoire.Parmi eux, gpt-oss-120b peut fonctionner efficacement sur un seul GPU de 80 Go, tandis que gpt-oss-20b peut fonctionner sur des appareils de pointe avec seulement 16 Go de mémoire.
Dans les évaluations de tâches réelles, gpt-oss-120b a surpassé o3-mini dans Codeforces, MMLU, HLE et l'appel d'outil TauBench, et était à égalité ou même surpassé o4-mini.De plus, il surpasse o4-mini sur HealthBench et AIME 2024 et 2025. Malgré une taille de paramètre de modèle plus petite, gpt-oss-20b fonctionne presque aussi bien que o3-mini sur ces mêmes évaluations.
Afin de permettre à chacun de découvrir gpt-oss plus facilement,Le « déploiement Llama.cpp+open-webui de Gpt-oss-20b » est désormais disponible dans la section « Tutoriels » du site officiel d'HyperAI (hyper.ai).Commencez en un clic et découvrez les puissantes capacités du modèle SOTA open source basé sur une seule carte NVIDIA RTX 4090.
en outre,Le tutoriel pour gpt-oss-120b est également en cours de production et nous l'attendons avec impatience !
Lien du tutoriel :
Essai de démonstration
1. Sur la page d'accueil hyper.ai, sélectionnez la page Tutoriels, choisissez Llama.cpp+open-webui pour déployer gpt-oss-20b, puis cliquez sur Exécuter ce tutoriel en ligne.


2. Une fois la page affichée, cliquez sur « Cloner » dans le coin supérieur droit pour cloner le didacticiel dans votre propre conteneur.

3. Sélectionnez les images « NVIDIA GeForce RTX 4090 » et « PyTorch », puis choisissez « Paiement à l'utilisation » ou « Forfait journalier/hebdomadaire/mensuel » selon vos besoins, puis cliquez sur « Continuer ». Les nouveaux utilisateurs peuvent s'inscrire via le lien d'invitation ci-dessous pour obtenir 4 heures de RTX 4090 et 5 heures de temps processeur gratuit !
Lien d'invitation exclusif HyperAI (copier et ouvrir dans le navigateur) :
https://openbayes.com/console/signup?r=Ada0322_NR0n


4. Attendez que les ressources soient allouées. Le premier clonage prendra environ 3 minutes. Lorsque le statut passe à « En cours d'exécution », cliquez sur la flèche à côté de « Adresse API » pour accéder à la page de démonstration. Veuillez noter que les utilisateurs doivent s'authentifier avec leur nom réel avant d'utiliser l'adresse API.


Démonstration d'effet
Après avoir accédé à la page d'exécution de la démonstration, entrez Prompt dans la boîte de dialogue et cliquez sur Exécuter.
L'auteur a effectué un test simple sur la création de contenu du modèle, la résolution de problèmes mathématiques et la capacité de raisonnement, et les réponses de gpt-oss étaient toutes assez bonnes.

Invite : Veuillez écrire un scénario comique sur les jeudis fous de KFC, environ 300 mots.

Invite : Quels sont les premier et deuxième chiffres après la virgule de (racine carrée de 2 + racine carrée de 3) à la puissance 2006 ?

Invite : Déterminez si la logique est correcte : Parce que le meurtrier n'est pas un routard et que vous n'êtes pas un routard, vous êtes le meurtrier.
Le tutoriel ci-dessus est celui recommandé par HyperAI cette fois-ci. Bienvenue à tous pour le découvrir !
Lien du tutoriel :