ERNIE-4.5-21B-A3B-Thinking: Verbesserte Fähigkeiten Zur Leichten Modellbegründung
1. Einführung in das Tutorial

ERNIE-4.5-21B-A3B-Thinking ist ein leichtgewichtiges Reasoning-Modell „Thinking Edition“, das im September 2025 vom Baidu Wenxin Yiyan-Team veröffentlicht wurde. ERNIE-4.5-21B-A3B-Thinking verwendet eine Mischung aus Experten (MoE)-Architektur mit einer Gesamtparametergröße von 21B. Jeder Token aktiviert 3B Parameter und wird durch Anweisungsfeinabstimmung und bestärkendes Lernen trainiert. ERNIE-4.5-21B-A3B-Thinking ist ein Deep-Thinking-Modell, das auf Basis von ERNIE-4.5-21B-A3B trainiert wurde. Es unterstützt ein Kontextfenster von 128K und eignet sich für komplexe Reasoning-Aufgaben, die einen langen Kontext erfordern. Dieses Modell erzielt nicht nur signifikante Verbesserungen bei Aufgaben, die menschliche Experten erfordern, wie z. B. logisches Denken, Mathematik, Naturwissenschaften sowie Code- und Textgenerierung, sondern verfügt auch über effiziente Tool-Aufruffunktionen und kann die automatisierte Bearbeitung komplexer Aufgaben unterstützen. Die relevanten Ergebnisse der Studie lauten:Technischer Bericht ERNIE4.5".
Die in diesem Tutorial verwendeten Rechenressourcen sind eine einzelne RTX A6000-Karte.
2. Effektanzeige

3. Bedienungsschritte
1. Starten Sie den Container
Wenn „Modell“ nicht angezeigt wird, bedeutet dies, dass das Modell initialisiert wird. Da das Modell groß ist, warten Sie bitte etwa 3–4 Minuten und aktualisieren Sie die Seite.

2. Anwendungsschritte

4. Diskussion
🖌️ Wenn Sie ein hochwertiges Projekt sehen, hinterlassen Sie bitte im Hintergrund eine Nachricht, um es weiterzuempfehlen! Darüber hinaus haben wir auch eine Tutorien-Austauschgruppe ins Leben gerufen. Willkommen, Freunde, scannen Sie den QR-Code und kommentieren Sie [SD-Tutorial], um der Gruppe beizutreten, verschiedene technische Probleme zu besprechen und Anwendungsergebnisse auszutauschen ↓

Zitationsinformationen
Die Zitationsinformationen für dieses Projekt lauten wie folgt:
@misc{ernie2025technicalreport,
title={ERNIE 4.5 Technical Report},
author={Baidu-ERNIE-Team},
year={2025},
primaryClass={cs.CL},
howpublished={\url{https://ernie.baidu.com/blog/publication/ERNIE_Technical_Report.pdf}}
}