HyperAIHyperAI

ERNIE-4.5-21B-A3B-Thinking: تم تطوير قدرات التفكير النموذجي البسيط

1. مقدمة البرنامج التعليمي

يبني

ERNIE-4.5-21B-A3B-Thinking هو نموذج استدلال بسيط "نسخة التفكير" أصدره فريق Baidu Wenxin Yiyan في سبتمبر 2025. يعتمد ERNIE-4.5-21B-A3B-Thinking على بنية مزيج من الخبراء (MoE) بحجم معاملات إجمالي يبلغ 21B. يُفعّل كل رمز 3B من المعاملات، ويتم تدريبه من خلال الضبط الدقيق للتعليمات والتعلم التعزيزي. ERNIE-4.5-21B-A3B-Thinking هو نموذج تفكير عميق مُدرّب على أساس ERNIE-4.5-21B-A3B. يدعم نافذة سياقية بحجم 128 كيلوبايت، وهو مناسب لمهام الاستدلال المعقدة التي تتطلب سياقًا طويلًا. لا يُحقق هذا النموذج تحسينات كبيرة في المهام التي تتطلب خبراء بشريين، مثل التفكير المنطقي والرياضيات والعلوم وتوليد الأكواد والنصوص فحسب، بل يتميز أيضًا بقدرات استدعاء أدوات فعّالة، ويمكنه دعم المعالجة الآلية للمهام المعقدة. نتائج البحث ذات الصلة هي:تقرير فني ERNIE4.5".

موارد الحوسبة المستخدمة في هذا البرنامج التعليمي هي بطاقة RTX A6000 واحدة.

2. عرض التأثير

3. خطوات التشغيل

1. ابدأ تشغيل الحاوية

إذا لم يتم عرض "النموذج"، فهذا يعني أنه يتم تهيئة النموذج. نظرًا لأن النموذج كبير الحجم، يرجى الانتظار لمدة 3-4 دقائق وتحديث الصفحة.

2. خطوات الاستخدام

4. المناقشة

🖌️ إذا رأيت مشروعًا عالي الجودة، فيرجى ترك رسالة في الخلفية للتوصية به! بالإضافة إلى ذلك، قمنا أيضًا بتأسيس مجموعة لتبادل الدروس التعليمية. مرحبًا بالأصدقاء لمسح رمز الاستجابة السريعة وإضافة [برنامج تعليمي SD] للانضمام إلى المجموعة لمناقشة المشكلات الفنية المختلفة ومشاركة نتائج التطبيق↓

معلومات الاستشهاد

معلومات الاستشهاد لهذا المشروع هي كما يلي:

@misc{ernie2025technicalreport,
      title={ERNIE 4.5 Technical Report},
      author={Baidu-ERNIE-Team},
      year={2025},
      primaryClass={cs.CL},
      howpublished={\url{https://ernie.baidu.com/blog/publication/ERNIE_Technical_Report.pdf}}
}