HyperAI

Déployer EXAONE-4.0-32B Avec vLLM + Open WebUI

1. Introduction au tutoriel

Étoiles GitHub

EXAONE-4.0 est un modèle d'IA de raisonnement hybride de nouvelle génération, lancé par le LG AI Research Institute en Corée du Sud le 15 juillet 2025. Il s'agit également du premier modèle d'IA de raisonnement hybride en Corée du Sud. Ce modèle combine des capacités générales de traitement du langage naturel avec des capacités de raisonnement avancées vérifiées par EXAONE Deep, et réalise des avancées majeures dans des domaines complexes tels que les mathématiques, les sciences et la programmation. Il prend en charge les fonctions MCP et d'appel de fonction, fournissant ainsi une base technique pour l'IA agentique. Le modèle professionnel 32B qu'il a publié a réussi six examens écrits nationaux de licence professionnelle, et ses derniers scores aux tests de référence mondiaux de difficulté élevée sont les suivants : raisonnement intellectuel : MMLU-Pro 81,8 points ; compétence en programmation : LiveCodeBench v6 66,7 points ; culture scientifique : GPQA-Diamond 75,4 points ; compétence mathématique : AIME 2025 85,3 points. Les résultats des épreuves sont les suivants :EXAONE 4.0 : Modèles de langage unifiés de grande taille intégrant les modes de raisonnement et de non-raisonnement".

Ce tutoriel utilise les ressources du A6000 double SIM.

2. Exemples de projets

1. Désactivez le mode réflexion 

 2. Commencez à réfléchir 

3. Étapes de l'opération

1. Après avoir démarré le conteneur, cliquez sur l'adresse API pour accéder à l'interface Web 

2. Après être entré sur la page Web, vous pouvez démarrer une conversation avec le modèle

Si « Modèle » n'apparaît pas, cela signifie que le modèle est en cours d'initialisation. Le modèle étant volumineux, veuillez patienter 2 à 3 minutes avant d'actualiser la page.

Comment utiliser 

4. Discussion

🖌️ Si vous voyez un projet de haute qualité, veuillez laisser un message en arrière-plan pour le recommander ! De plus, nous avons également créé un groupe d’échange de tutoriels. Bienvenue aux amis pour scanner le code QR et commenter [Tutoriel SD] pour rejoindre le groupe pour discuter de divers problèmes techniques et partager les résultats de l'application↓

Informations sur la citation

Les informations de citation pour ce projet sont les suivantes :

@article{exaone-4.0,
  title={EXAONE 4.0: Unified Large Language Models Integrating Non-reasoning and Reasoning Modes},
  author={{LG AI Research}},
  journal={arXiv preprint arXiv:2507.11407},
  year={2025}
}