HyperAIHyperAI

Command Palette

Search for a command to run...

مجموعة بيانات مهمة الاستدلال العام واسعة النطاق AM-DeepSeek-R1-Distilled-1.4M

التاريخ

منذ 7 أشهر

الحجم

47.22 GB

المؤسسة

رابط النشر

github.com

رابط الورقة البحثية

arxiv.org

العلامات

AM-DeepSeek-R1-Distilled-1.4M هي مجموعة بيانات واسعة النطاق لمهام الاستدلال العام، أصدرها فريق am في مارس 2025. نتائج الورقة البحثية ذات الصلة هي "1.4 مليون مجموعة بيانات استدلالية مفتوحة المصدر لتمكين تدريب نماذج اللغة الكبيرة".

تحتوي مجموعة البيانات على ما يقرب من 1.4 مليون إدخال بيانات، تغطي مجموعة متنوعة من أنواع الأسئلة بما في ذلك الرياضيات والترميز والأسئلة والأجوبة العلمية والدردشة العامة. لقد تم اختيار هذه البيانات بعناية، وتم إزالة التكرارات الدلالية منها وتنظيفها بدقة لضمان الجودة العالية والتحدي الذي تتمتع به البيانات. يحتوي كل إدخال في مجموعة البيانات على مسارات تفكير غنية، والتي لا تزود النموذج بأمثلة لعملية التفكير فحسب، بل تساعد النموذج أيضًا على فهم مهام التفكير المعقدة وتوليد حلول لها بشكل أفضل. يهدف إصدار مجموعة البيانات AM-DeepSeek-R1-Distilled-1.4M إلى توفير أداة قوية لمعالجة اللغة الطبيعية ومهام الاستدلال، وخاصة لتدريب وتحسين قدرات الاستدلال للنماذج اللغوية الكبيرة. ويمكن أن يساعد النماذج على تحسين أدائها في مجالات رئيسية مثل الرياضيات والترميز والإجابة على الأسئلة العلمية، حتى تتمكن من التعامل بشكل أفضل مع مهام التفكير المعقدة المختلفة.

AM-DeepSeek-R1-Distilled-1.4M.torrent
البذر 1التنزيل 0مكتمل 71إجمالي التنزيلات 159
  • AM-DeepSeek-R1-Distilled-1.4M/
    • README.md
      1.8 KB
    • README.txt
      3.6 KB
      • data/
        • main.zip
          10.32 GB
          • main/
            • README.md
              10.32 GB
            • am_0.5M.jsonl
              23.84 GB
            • am_0.5M.jsonl.zst
              25.76 GB
            • am_0.9M.jsonl
              44.19 GB
            • am_0.9M.jsonl.zst
              47.19 GB
            • am_0.9M_sample_1k.jsonl
              47.21 GB
            • am_0.9M_sample_1k.jsonl.zst
              47.22 GB

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — عجّل تطوير الذكاء الاصطناعي الخاص بك من خلال البرمجة المشتركة المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة المشتركة بالذكاء الاصطناعي
وحدات معالجة رسومات جاهزة
أفضل الأسعار
ابدأ الآن

Hyper Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp
مجموعة بيانات مهمة الاستدلال العام واسعة النطاق AM-DeepSeek-R1-Distilled-1.4M | مجموعات البيانات | HyperAI