استخدم مجموعة البيانات هذه ناقش على Discord

التاريخ

منذ 10 أشهر

المؤسسة

رابط الورقة البحثية

2505.00949

الترخيص

CC BY 4.0

الوسوم

تدريب النموذج

مجموعة بيانات ما بعد التدريب Llama-Nemotron هي مجموعة بيانات ما بعد التدريب واسعة النطاق مفتوحة المصدر من NVIDIA في عام 2025. نتائج الورقة ذات الصلة هي "لاما-نيموترون: نماذج استدلال فعّالة"، والذي يهدف إلى تحسين قدرات الرياضيات والترميز والتفكير العام واتباع التعليمات في نماذج سلسلة Llama-Nemotron في مرحلة ما بعد التدريب (مثل SFT وRL). تجمع هذه المجموعة من البيانات بيانات من مرحلتي الضبط الدقيق المُشرف (SFT) والتعلم المُعزّز (RL). الإصدار الحالي، الإصدار 1.1 (الذي يضيف حوالي 2.2 مليون عينة رياضية و500,000 عينة استدلال برمجي مقارنةً بالإصدار السابق)، مناسب لتدريب وكلاء الذكاء الاصطناعي، وروبوتات الدردشة، وأنظمة RAG، وغيرها من التطبيقات المُدارة بالذكاء الاصطناعي. توزيع البيانات (حسب عدد إدخالات الفئة)

الرياضيات: 22,066,397
الرمز: 10,108,883
العلوم: 708,920
التعليمات التالية: 56,339
الدردشة: 39,792
السلامة: 31,426

تم المساهمة بهذه المجموعة من البيانات من قبل مستخدمي المجتمع وهي مخصصة للأغراض التعليمية والإعلامية فقط. إذا كان أي محتوى ينطوي على انتهاك لحقوق النشر، يرجى الاتصال بنا على [email protected] للمراجعة والإزالة الفورية.

مجموعات البيانات ذات الصلة

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي

وحدات GPU جاهزة للعمل

أفضل الأسعار

ابدأ عرض الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا

سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين

مدعوم بواسطة MailChimp

HyperAI

استخدم مجموعة البيانات هذه ناقش على Discord

التاريخ

منذ 10 أشهر

المؤسسة

رابط الورقة البحثية

2505.00949

الترخيص

CC BY 4.0

الوسوم

تدريب النموذج

الرياضيات: 22,066,397
الرمز: 10,108,883
العلوم: 708,920
التعليمات التالية: 56,339
الدردشة: 39,792
السلامة: 31,426

مجموعات البيانات ذات الصلة

Nemotron Personas France (مجموعة بيانات الشخصيات الاصطناعية الفرنسية)

منذ 2 أشهر

مجموعة بيانات ثقافة الميمات على الإنترنت الصينية zh-meme-sft-8k

منذ 3 أشهر

مجموعة بيانات أحداث الفيضانات العالمية من Groundsource

منذ 3 أشهر

مجموعة بيانات اصطناعية للاستدلال العام من CHIMERA

منذ 4 أشهر

مجموعة بيانات RubricHub_v1 متعددة المجالات للمهام التوليدية

منذ 5 أشهر

مجموعة بيانات الشخصيات الاصطناعية البرازيلية Nemotron-Personas-Brazil

منذ 5 أشهر

مجموعة بيانات الاستدلال الرياضي Nemotron-Math-v2

منذ 5 أشهر

مجموعة بيانات الاستدلال متعدد المهام TxT360-3efforts

منذ 5 أشهر

مجموعة بيانات الكشف عن الممنوعات بالأشعة السينية

منذ 5 أشهر

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

البرمجة التعاونية باستخدام الذكاء الاصطناعي

وحدات GPU جاهزة للعمل

أفضل الأسعار

ابدأ عرض الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا

سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين

مدعوم بواسطة MailChimp

Command Palette

مجموعة بيانات ما بعد التدريب Llama-Nemotron مجموعة بيانات ما بعد التدريب

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

HyperAI Newsletters

Command Palette

مجموعة بيانات ما بعد التدريب Llama-Nemotron مجموعة بيانات ما بعد التدريب

مجموعات البيانات ذات الصلة

Nemotron Personas France (مجموعة بيانات الشخصيات الاصطناعية الفرنسية)

مجموعة بيانات ثقافة الميمات على الإنترنت الصينية zh-meme-sft-8k

مجموعة بيانات أحداث الفيضانات العالمية من Groundsource

مجموعة بيانات اصطناعية للاستدلال العام من CHIMERA

مجموعة بيانات RubricHub_v1 متعددة المجالات للمهام التوليدية

مجموعة بيانات الشخصيات الاصطناعية البرازيلية Nemotron-Personas-Brazil

مجموعة بيانات الاستدلال الرياضي Nemotron-Math-v2

مجموعة بيانات الاستدلال متعدد المهام TxT360-3efforts

مجموعة بيانات الكشف عن الممنوعات بالأشعة السينية

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

HyperAI Newsletters

Command Palette

مجموعة بيانات ما بعد التدريب Llama-Nemotron مجموعة بيانات ما بعد التدريب

مجموعات البيانات ذات الصلة

Nemotron Personas France (مجموعة بيانات الشخصيات الاصطناعية الفرنسية)

مجموعة بيانات ثقافة الميمات على الإنترنت الصينية zh-meme-sft-8k

مجموعة بيانات أحداث الفيضانات العالمية من Groundsource

مجموعة بيانات اصطناعية للاستدلال العام من CHIMERA

مجموعة بيانات RubricHub_v1 متعددة المجالات للمهام التوليدية

مجموعة بيانات الشخصيات الاصطناعية البرازيلية Nemotron-Personas-Brazil

مجموعة بيانات الاستدلال الرياضي Nemotron-Math-v2

مجموعة بيانات الاستدلال متعدد المهام TxT360-3efforts

مجموعة بيانات الكشف عن الممنوعات بالأشعة السينية

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

HyperAI Newsletters

مجموعات البيانات ذات الصلة

Nemotron Personas France (مجموعة بيانات الشخصيات الاصطناعية الفرنسية)

مجموعة بيانات ثقافة الميمات على الإنترنت الصينية zh-meme-sft-8k

مجموعة بيانات أحداث الفيضانات العالمية من Groundsource

مجموعة بيانات اصطناعية للاستدلال العام من CHIMERA

مجموعة بيانات RubricHub_v1 متعددة المجالات للمهام التوليدية

مجموعة بيانات الشخصيات الاصطناعية البرازيلية Nemotron-Personas-Brazil

مجموعة بيانات الاستدلال الرياضي Nemotron-Math-v2

مجموعة بيانات الاستدلال متعدد المهام TxT360-3efforts

مجموعة بيانات الكشف عن الممنوعات بالأشعة السينية

مجموعات البيانات ذات الصلة

Nemotron Personas France (مجموعة بيانات الشخصيات الاصطناعية الفرنسية)

مجموعة بيانات ثقافة الميمات على الإنترنت الصينية zh-meme-sft-8k

مجموعة بيانات أحداث الفيضانات العالمية من Groundsource

مجموعة بيانات اصطناعية للاستدلال العام من CHIMERA

مجموعة بيانات RubricHub_v1 متعددة المجالات للمهام التوليدية

مجموعة بيانات الشخصيات الاصطناعية البرازيلية Nemotron-Personas-Brazil

مجموعة بيانات الاستدلال الرياضي Nemotron-Math-v2

مجموعة بيانات الاستدلال متعدد المهام TxT360-3efforts

مجموعة بيانات الكشف عن الممنوعات بالأشعة السينية