ERNIE-4.5-21B-A3B-Thinking : Amélioration Des Capacités De Raisonnement Sur Modèle Léger
1. Introduction au tutoriel

ERNIE-4.5-21B-A3B-Thinking est un modèle de raisonnement léger « Thinking Edition », publié par l'équipe Baidu Wenxin Yiyan en septembre 2025. ERNIE-4.5-21B-A3B-Thinking adopte une architecture mixte d'experts (MoE) avec une taille totale de paramètres de 21 B. Chaque jeton active 3 B paramètres et est entraîné par le réglage fin des instructions et l'apprentissage par renforcement. ERNIE-4.5-21B-A3B-Thinking est un modèle de pensée profonde entraîné sur la base d'ERNIE-4.5-21B-A3B. Il prend en charge une fenêtre contextuelle de 128 Ko et convient aux tâches de raisonnement complexes nécessitant un contexte long. Ce modèle apporte non seulement des améliorations significatives pour les tâches nécessitant des experts humains, telles que le raisonnement logique, les mathématiques, les sciences, la génération de code et de texte, mais dispose également de capacités d'appel d'outils efficaces et peut prendre en charge le traitement automatisé de tâches complexes. Les résultats de l'article sont les suivants :Rapport technique ERNIE4.5".
Les ressources informatiques utilisées dans ce tutoriel sont une seule carte RTX A6000.
2. Affichage des effets

3. Étapes de l'opération
1. Démarrez le conteneur
Si « Modèle » n'est pas affiché, cela signifie que le modèle est en cours d'initialisation. Étant donné que le modèle est grand, veuillez patienter environ 3 à 4 minutes et actualiser la page.

2. Étapes d'utilisation

4. Discussion
🖌️ Si vous voyez un projet de haute qualité, veuillez laisser un message en arrière-plan pour le recommander ! De plus, nous avons également créé un groupe d’échange de tutoriels. Bienvenue aux amis pour scanner le code QR et commenter [Tutoriel SD] pour rejoindre le groupe pour discuter de divers problèmes techniques et partager les résultats de l'application↓

Informations sur la citation
Les informations de citation pour ce projet sont les suivantes :
@misc{ernie2025technicalreport,
title={ERNIE 4.5 Technical Report},
author={Baidu-ERNIE-Team},
year={2025},
primaryClass={cs.CL},
howpublished={\url{https://ernie.baidu.com/blog/publication/ERNIE_Technical_Report.pdf}}
}