HyperAIHyperAI

Command Palette

Search for a command to run...

مجموعة بيانات الضبط الدقيق المُشرف عليها Nemotron-Pretraining-SFT-v1

التاريخ

منذ 2 أشهر

المؤسسة

إنفيديا

رابط الورقة البحثية

2508.14444

الترخيص

أخرى

انضم إلى مجتمع Discord

Nemotron-Pretraining-SFT-v1 هي مجموعة بيانات توليدية اصطناعية أصدرتها NVIDIA في عام 2025. الورقة البحثية ذات الصلة هي "NVIDIA Nemotron Nano 2: نموذج استدلال هجين دقيق وفعال لمحول مامبا"، والتي تهدف إلى تحسين قدرات النموذج في مهام مثل متابعة التعليمات، والاستدلال، والترميز، والإجابة على الأسئلة العامة.

تستهدف هذه المجموعة من البيانات مجالات العلوم والتكنولوجيا والهندسة والرياضيات (STEM)، والمجالات الأكاديمية، والتفكير المنطقي، والمجالات متعددة اللغات. وهي موسّعة ومُولّدة من مواد رياضية وعلوم عالية الجودة، وتجمع بين نصوص أكاديمية للدراسات العليا وبيانات SFT مُوجّهة ومُحسّنة، وذلك لبناء أسئلة اختيار من متعدد وأسئلة تحليلية مُعقدة (مع إجابات/أفكار شاملة)، تُغطي مهامًا مُتعددة مثل الرياضيات، والبرمجة، والمعرفة العامة، والتفكير المنطقي.

في الإحصائيات الرسمية لبيانات التدريب المسبق لـ Nemotron، تشغل الفئات المرتبطة بـ SFT (مثل Math SFT وCode SFT وGeneral SFT) نسبة كبيرة، مما يجعل من السهل على المستخدمين تصفية المجموعات الفرعية المطلوبة وفقًا للبيانات الوصفية للتجارب القابلة للتكرار.

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — عجّل تطوير الذكاء الاصطناعي الخاص بك من خلال البرمجة المشتركة المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة المشتركة بالذكاء الاصطناعي
وحدات معالجة رسومات جاهزة
أفضل الأسعار
ابدأ الآن

Hyper Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp