HyperAIHyperAI

Command Palette

Search for a command to run...

ERNIE-4.5-21B-A3B-Thinking: Verbesserte Fähigkeiten Zur Leichten Modellbegründung

Date

vor 4 Monaten

Size

16.36 MB

Tags

License

Apache 2.0

1. Einführung in das Tutorial

Bauen

ERNIE-4.5-21B-A3B-Thinking ist ein leichtgewichtiges Modell für logisches Denken, die „Thinking Edition“, die im September 2025 vom Baidu Wenxin Yiyan Team veröffentlicht wurde. ERNIE-4.5-21B-A3B-Thinking verwendet eine hybride Expertenarchitektur (MoE) mit insgesamt 21 Milliarden Parametern. Jedes Token aktiviert 3 Milliarden Parameter. Das Modell wird durch Feinabstimmung der Anweisungen und bestärkendes Lernen trainiert. ERNIE-4.5-21B-A3B-Thinking ist ein Deep-Thinking-Modell, das auf ERNIE-4.5-21B-A3B aufbaut und 128.000 Kontextfenster unterstützt. Dadurch eignet es sich für komplexe Denkaufgaben, die lange Kontexte erfordern. Dieses Modell erzielt nicht nur signifikante Verbesserungen bei Aufgaben, die menschliche Experten erfordern, wie logisches Denken, Mathematik, Naturwissenschaften, Code- und Textgenerierung, sondern verfügt auch über effiziente Werkzeugaufruffunktionen und unterstützt so die automatisierte Verarbeitung komplexer Aufgaben. Zugehörige Forschungsarbeiten sind verfügbar. Technischer Bericht ERNIE4.5 .

Die in diesem Tutorial verwendeten Rechenressourcen sind eine einzelne RTX A6000-Karte.

2. Effektanzeige

3. Bedienungsschritte

1. Starten Sie den Container

Wenn „Modell“ nicht angezeigt wird, bedeutet dies, dass das Modell initialisiert wird. Da das Modell groß ist, warten Sie bitte etwa 3–4 Minuten und aktualisieren Sie die Seite.

2. Anwendungsschritte

4. Diskussion

🖌️ Wenn Sie ein hochwertiges Projekt sehen, hinterlassen Sie bitte im Hintergrund eine Nachricht, um es weiterzuempfehlen! Darüber hinaus haben wir auch eine Tutorien-Austauschgruppe ins Leben gerufen. Willkommen, Freunde, scannen Sie den QR-Code und kommentieren Sie [SD-Tutorial], um der Gruppe beizutreten, verschiedene technische Probleme zu besprechen und Anwendungsergebnisse auszutauschen ↓

Zitationsinformationen

Die Zitationsinformationen für dieses Projekt lauten wie folgt:

@misc{ernie2025technicalreport,
      title={ERNIE 4.5 Technical Report},
      author={Baidu-ERNIE-Team},
      year={2025},
      primaryClass={cs.CL},
      howpublished={\url{https://ernie.baidu.com/blog/publication/ERNIE_Technical_Report.pdf}}
}

Build AI with AI

From idea to launch — accelerate your AI development with free AI co-coding, out-of-the-box environment and best price of GPUs.

AI Co-coding
Ready-to-use GPUs
Best Pricing

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp