HyperAIHyperAI

Command Palette

Search for a command to run...

مجموعة بيانات الضبط الدقيق المُشرف عليها Nemotron-Pretraining-SFT-v1

ناقش على Discord

التاريخ

منذ 5 أشهر

المؤسسة

إنفيديا

رابط الورقة البحثية

2508.14444

الترخيص

Other

الوسوم

Nemotron-Pretraining-SFT-v1 هي مجموعة بيانات توليدية اصطناعية أصدرتها NVIDIA في عام 2025. الورقة البحثية ذات الصلة هي "NVIDIA Nemotron Nano 2: نموذج استدلال هجين دقيق وفعال لمحول مامبا"، والتي تهدف إلى تحسين قدرات النموذج في مهام مثل متابعة التعليمات، والاستدلال، والترميز، والإجابة على الأسئلة العامة.

تستهدف هذه المجموعة من البيانات مجالات العلوم والتكنولوجيا والهندسة والرياضيات (STEM)، والمجالات الأكاديمية، والتفكير المنطقي، والمجالات متعددة اللغات. وهي موسّعة ومُولّدة من مواد رياضية وعلوم عالية الجودة، وتجمع بين نصوص أكاديمية للدراسات العليا وبيانات SFT مُوجّهة ومُحسّنة، وذلك لبناء أسئلة اختيار من متعدد وأسئلة تحليلية مُعقدة (مع إجابات/أفكار شاملة)، تُغطي مهامًا مُتعددة مثل الرياضيات، والبرمجة، والمعرفة العامة، والتفكير المنطقي.

في الإحصائيات الرسمية لبيانات التدريب المسبق لـ Nemotron، تشغل الفئات المرتبطة بـ SFT (مثل Math SFT وCode SFT وGeneral SFT) نسبة كبيرة، مما يجعل من السهل على المستخدمين تصفية المجموعات الفرعية المطلوبة وفقًا للبيانات الوصفية للتجارب القابلة للتكرار.

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp