HyperAIHyperAI

Command Palette

Search for a command to run...

مجموعة بيانات الضبط الدقيق المُشرف عليها Nemotron-Pretraining-SFT-v1

Discuss on Discord

Date

منذ 4 أشهر

Organization

إنفيديا

Paper URL

2508.14444

License

Other

Tags

Nemotron-Pretraining-SFT-v1 هي مجموعة بيانات توليدية اصطناعية أصدرتها NVIDIA في عام 2025. الورقة البحثية ذات الصلة هي "NVIDIA Nemotron Nano 2: نموذج استدلال هجين دقيق وفعال لمحول مامبا"، والتي تهدف إلى تحسين قدرات النموذج في مهام مثل متابعة التعليمات، والاستدلال، والترميز، والإجابة على الأسئلة العامة.

تستهدف هذه المجموعة من البيانات مجالات العلوم والتكنولوجيا والهندسة والرياضيات (STEM)، والمجالات الأكاديمية، والتفكير المنطقي، والمجالات متعددة اللغات. وهي موسّعة ومُولّدة من مواد رياضية وعلوم عالية الجودة، وتجمع بين نصوص أكاديمية للدراسات العليا وبيانات SFT مُوجّهة ومُحسّنة، وذلك لبناء أسئلة اختيار من متعدد وأسئلة تحليلية مُعقدة (مع إجابات/أفكار شاملة)، تُغطي مهامًا مُتعددة مثل الرياضيات، والبرمجة، والمعرفة العامة، والتفكير المنطقي.

في الإحصائيات الرسمية لبيانات التدريب المسبق لـ Nemotron، تشغل الفئات المرتبطة بـ SFT (مثل Math SFT وCode SFT وGeneral SFT) نسبة كبيرة، مما يجعل من السهل على المستخدمين تصفية المجموعات الفرعية المطلوبة وفقًا للبيانات الوصفية للتجارب القابلة للتكرار.

Build AI with AI

From idea to launch — accelerate your AI development with free AI co-coding, out-of-the-box environment and best price of GPUs.

AI Co-coding
Ready-to-use GPUs
Best Pricing

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp