HyperAIHyperAI

Command Palette

Search for a command to run...

ERNIE-4.5-21B-A3B-Thinking: Verbesserte Fähigkeiten Zur Leichten Modellbegründung

1. Einführung in das Tutorial

Bauen

ERNIE-4.5-21B-A3B-Thinking ist ein leichtgewichtiges Reasoning-Modell „Thinking Edition“, das im September 2025 vom Baidu Wenxin Yiyan-Team veröffentlicht wurde. ERNIE-4.5-21B-A3B-Thinking verwendet eine Mischung aus Experten (MoE)-Architektur mit einer Gesamtparametergröße von 21B. Jeder Token aktiviert 3B Parameter und wird durch Anweisungsfeinabstimmung und bestärkendes Lernen trainiert. ERNIE-4.5-21B-A3B-Thinking ist ein Deep-Thinking-Modell, das auf Basis von ERNIE-4.5-21B-A3B trainiert wurde. Es unterstützt ein Kontextfenster von 128K und eignet sich für komplexe Reasoning-Aufgaben, die einen langen Kontext erfordern. Dieses Modell erzielt nicht nur signifikante Verbesserungen bei Aufgaben, die menschliche Experten erfordern, wie z. B. logisches Denken, Mathematik, Naturwissenschaften sowie Code- und Textgenerierung, sondern verfügt auch über effiziente Tool-Aufruffunktionen und kann die automatisierte Bearbeitung komplexer Aufgaben unterstützen. Die relevanten Ergebnisse der Studie lauten:Technischer Bericht ERNIE4.5".

Die in diesem Tutorial verwendeten Rechenressourcen sind eine einzelne RTX A6000-Karte.

2. Effektanzeige

3. Bedienungsschritte

1. Starten Sie den Container

Wenn „Modell“ nicht angezeigt wird, bedeutet dies, dass das Modell initialisiert wird. Da das Modell groß ist, warten Sie bitte etwa 3–4 Minuten und aktualisieren Sie die Seite.

2. Anwendungsschritte

4. Diskussion

🖌️ Wenn Sie ein hochwertiges Projekt sehen, hinterlassen Sie bitte im Hintergrund eine Nachricht, um es weiterzuempfehlen! Darüber hinaus haben wir auch eine Tutorien-Austauschgruppe ins Leben gerufen. Willkommen, Freunde, scannen Sie den QR-Code und kommentieren Sie [SD-Tutorial], um der Gruppe beizutreten, verschiedene technische Probleme zu besprechen und Anwendungsergebnisse auszutauschen ↓

Zitationsinformationen

Die Zitationsinformationen für dieses Projekt lauten wie folgt:

@misc{ernie2025technicalreport,
      title={ERNIE 4.5 Technical Report},
      author={Baidu-ERNIE-Team},
      year={2025},
      primaryClass={cs.CL},
      howpublished={\url{https://ernie.baidu.com/blog/publication/ERNIE_Technical_Report.pdf}}
}

KI mit KI entwickeln

Von der Idee bis zum Start — beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und den besten GPU-Preisen.

KI-Co-Coding
Sofort einsatzbereit GPUs
Beste Preise
Jetzt starten

Hyper Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp
ERNIE-4.5-21B-A3B-Thinking: Verbesserte Fähigkeiten Zur Leichten Modellbegründung | Tutorials | HyperAI