HyperAI

مجموعة بيانات الاستدلال OpenThoughts2-1M

التاريخ

منذ 13 أيام

الحجم

6.91 GB

رابط النشر

huggingface.co

OpenThoughts2-1M هي مجموعة بيانات استدلالية مفتوحة المصدر أصدرتها Open Thoughts في عام 2025. نتائج الورقة ذات الصلة هي:OpenThoughts: وصفات البيانات لنماذج الاستدلال".

تعتمد مجموعة البيانات على مجموعة بيانات OpenThoughts-114k، مُضيفةً مجموعات بيانات موجودة مثل OpenR1 وبيانات أخرى للرياضيات والتفكير البرمجي. تحتوي البيانات على مليون مثال عالي الجودة يُغطي الرياضيات والعلوم والبرمجة والألغاز. يُضاهي أداء نموذج OpenThinker2 المُدرّب على هذه المجموعة أداء نموذج DeepSeek-R1-Distill.

بنية البيانات

open-thoughts2M.torrent
البذر 1التنزيل 0مكتمل 4إجمالي التنزيلات 7
  • open-thoughts2M/
    • README.md
      1.27 KB
    • README.txt
      2.54 KB
      • data/
        • open-thoughts2M.zip
          6.91 GB