Command Palette
Search for a command to run...
مجموعة بيانات الضبط الدقيق المُشرف عليها Nemotron-Pretraining-SFT-v1
التاريخ
رابط الورقة البحثية
الترخيص
أخرى
Nemotron-Pretraining-SFT-v1 هي مجموعة بيانات توليدية اصطناعية أصدرتها NVIDIA في عام 2025. الورقة البحثية ذات الصلة هي "NVIDIA Nemotron Nano 2: نموذج استدلال هجين دقيق وفعال لمحول مامبا"، والتي تهدف إلى تحسين قدرات النموذج في مهام مثل متابعة التعليمات، والاستدلال، والترميز، والإجابة على الأسئلة العامة.
تستهدف هذه المجموعة من البيانات مجالات العلوم والتكنولوجيا والهندسة والرياضيات (STEM)، والمجالات الأكاديمية، والتفكير المنطقي، والمجالات متعددة اللغات. وهي موسّعة ومُولّدة من مواد رياضية وعلوم عالية الجودة، وتجمع بين نصوص أكاديمية للدراسات العليا وبيانات SFT مُوجّهة ومُحسّنة، وذلك لبناء أسئلة اختيار من متعدد وأسئلة تحليلية مُعقدة (مع إجابات/أفكار شاملة)، تُغطي مهامًا مُتعددة مثل الرياضيات، والبرمجة، والمعرفة العامة، والتفكير المنطقي.
في الإحصائيات الرسمية لبيانات التدريب المسبق لـ Nemotron، تشغل الفئات المرتبطة بـ SFT (مثل Math SFT وCode SFT وGeneral SFT) نسبة كبيرة، مما يجعل من السهل على المستخدمين تصفية المجموعات الفرعية المطلوبة وفقًا للبيانات الوصفية للتجارب القابلة للتكرار.
بناء الذكاء الاصطناعي بالذكاء الاصطناعي
من الفكرة إلى الإطلاق — عجّل تطوير الذكاء الاصطناعي الخاص بك من خلال البرمجة المشتركة المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.