Command Palette
Search for a command to run...
ERNIE-4.5-21B-A3B-Thinking: Verbesserte Fähigkeiten Zur Leichten Modellbegründung
Date
Size
16.36 MB
Tags
License
Apache 2.0
GitHub
Paper URL
1. Einführung in das Tutorial

ERNIE-4.5-21B-A3B-Thinking ist ein leichtgewichtiges Modell für logisches Denken, die „Thinking Edition“, die im September 2025 vom Baidu Wenxin Yiyan Team veröffentlicht wurde. ERNIE-4.5-21B-A3B-Thinking verwendet eine hybride Expertenarchitektur (MoE) mit insgesamt 21 Milliarden Parametern. Jedes Token aktiviert 3 Milliarden Parameter. Das Modell wird durch Feinabstimmung der Anweisungen und bestärkendes Lernen trainiert. ERNIE-4.5-21B-A3B-Thinking ist ein Deep-Thinking-Modell, das auf ERNIE-4.5-21B-A3B aufbaut und 128.000 Kontextfenster unterstützt. Dadurch eignet es sich für komplexe Denkaufgaben, die lange Kontexte erfordern. Dieses Modell erzielt nicht nur signifikante Verbesserungen bei Aufgaben, die menschliche Experten erfordern, wie logisches Denken, Mathematik, Naturwissenschaften, Code- und Textgenerierung, sondern verfügt auch über effiziente Werkzeugaufruffunktionen und unterstützt so die automatisierte Verarbeitung komplexer Aufgaben. Zugehörige Forschungsarbeiten sind verfügbar. Technischer Bericht ERNIE4.5 .
Die in diesem Tutorial verwendeten Rechenressourcen sind eine einzelne RTX A6000-Karte.
2. Effektanzeige

3. Bedienungsschritte
1. Starten Sie den Container
Wenn „Modell“ nicht angezeigt wird, bedeutet dies, dass das Modell initialisiert wird. Da das Modell groß ist, warten Sie bitte etwa 3–4 Minuten und aktualisieren Sie die Seite.

2. Anwendungsschritte

4. Diskussion
🖌️ Wenn Sie ein hochwertiges Projekt sehen, hinterlassen Sie bitte im Hintergrund eine Nachricht, um es weiterzuempfehlen! Darüber hinaus haben wir auch eine Tutorien-Austauschgruppe ins Leben gerufen. Willkommen, Freunde, scannen Sie den QR-Code und kommentieren Sie [SD-Tutorial], um der Gruppe beizutreten, verschiedene technische Probleme zu besprechen und Anwendungsergebnisse auszutauschen ↓

Zitationsinformationen
Die Zitationsinformationen für dieses Projekt lauten wie folgt:
@misc{ernie2025technicalreport,
title={ERNIE 4.5 Technical Report},
author={Baidu-ERNIE-Team},
year={2025},
primaryClass={cs.CL},
howpublished={\url{https://ernie.baidu.com/blog/publication/ERNIE_Technical_Report.pdf}}
}Build AI with AI
From idea to launch — accelerate your AI development with free AI co-coding, out-of-the-box environment and best price of GPUs.