Command Palette
Search for a command to run...
مجموعة بيانات الضبط الدقيق المُشرف عليها Nemotron-Pretraining-SFT-v1
Nemotron-Pretraining-SFT-v1 هي مجموعة بيانات توليدية اصطناعية أصدرتها NVIDIA في عام 2025. الورقة البحثية ذات الصلة هي "NVIDIA Nemotron Nano 2: نموذج استدلال هجين دقيق وفعال لمحول مامبا"، والتي تهدف إلى تحسين قدرات النموذج في مهام مثل متابعة التعليمات، والاستدلال، والترميز، والإجابة على الأسئلة العامة.
تستهدف هذه المجموعة من البيانات مجالات العلوم والتكنولوجيا والهندسة والرياضيات (STEM)، والمجالات الأكاديمية، والتفكير المنطقي، والمجالات متعددة اللغات. وهي موسّعة ومُولّدة من مواد رياضية وعلوم عالية الجودة، وتجمع بين نصوص أكاديمية للدراسات العليا وبيانات SFT مُوجّهة ومُحسّنة، وذلك لبناء أسئلة اختيار من متعدد وأسئلة تحليلية مُعقدة (مع إجابات/أفكار شاملة)، تُغطي مهامًا مُتعددة مثل الرياضيات، والبرمجة، والمعرفة العامة، والتفكير المنطقي.
في الإحصائيات الرسمية لبيانات التدريب المسبق لـ Nemotron، تشغل الفئات المرتبطة بـ SFT (مثل Math SFT وCode SFT وGeneral SFT) نسبة كبيرة، مما يجعل من السهل على المستخدمين تصفية المجموعات الفرعية المطلوبة وفقًا للبيانات الوصفية للتجارب القابلة للتكرار.
Build AI with AI
From idea to launch — accelerate your AI development with free AI co-coding, out-of-the-box environment and best price of GPUs.