تغطي مجموعات بيانات الاستدلال عالية الجودة الرياضيات/الترميز/العلوم/الألغاز، ويتم تلخيصها للمساعدة في إعادة إنتاج قدرات الاستدلال القوية في DeepSeek

في الآونة الأخيرة، لا يزال الاهتمام بنماذج التفكير التي أثارها DeepSeek-R1 في ازدياد. في 31 يناير، أطلقت OpenAI نموذج التفكير الجديد o3-mini. في 18 فبراير، أطلقت xAI برنامج Grok 3، بما في ذلك Grok-3 Reasoning Beta وGrok-3 mini Reasoning مع إمكانيات التفكير. في 25 فبراير، أطلقت شركة Anthropic أول نموذج تفكير هجين لها وهو Claude 3.7 Sonnet.
في الواقع، في سياق التجانس المتزايد والمنافسة الشرسة بين النماذج الكبيرة، أصبحت القدرة على التفكير مؤشرًا مهمًا لقياس أدائها، كما أنها تمثل اتجاهًا مهمًا لتطوير الذكاء الاصطناعي للتقدم إلى الذكاء الاصطناعي العام. مع ظهور سقف تحسين الخوارزمية تدريجيًا، وضغط معلمات النموذج تدريجيًا إلى الحد الأقصى،أصبحت جودة البيانات أحد العوامل الرئيسية في تحديد ما إذا كان النموذج قادرًا على التحول من "ذاكرة الإجابة" البسيطة إلى "التفكير المنطقي" العميق.
إن إنشاء مجموعة بيانات الاستدلال ليس مجرد كومة بسيطة من الأسئلة. ولمنع النموذج من تسريب المعلومات أثناء التدريب والغش أثناء الاختبار، يجب عزل البيانات بشكل صارم بين مجموعة الاختبار ومجموعة التدريب، ويجب تقديم آلية تحديث ديناميكية لتحديث أنواع الأسئلة بانتظام. عند التعامل مع مهام معقدة مثل البراهين الرياضية وتوليد التعليمات البرمجية، من الضروري تصميم سلاسل منطقية متعددة بعناية عند بناء مجموعات البيانات، وتعيين ظروف الفخ المخفية بذكاء، ومحاكاة عملية التجربة والخطأ والتفكير لدى البشر في حل المشكلات قدر الإمكان، وذلك لتزويد النموذج بمواد تعليمية أقرب إلى سيناريوهات التطبيق الحقيقية.
إن الأداء المتميز الذي قدمته شركة DeepSeek في مسابقة AIME للرياضيات هو مثال حي على ذلك. ويعتمد على مجموعة البيانات OpenThoughts-114k.فهو يتناول سلسلة من المشاكل التي تتطلب الاستنتاج خطوة بخطوة وتتضمن سلاسل منطقية متعددة.بفضل آلية التحقق الصارمة وهيكل التفكير متعدد الخطوات المرتب بذكاء، يتم ضمان دقة البيانات وموثوقيتها مع السماح للنموذج بتعلم قدرات التفكير الأعمق بدلاً من الاعتماد فقط على "الذاكرة" للإجابة على الأسئلة.
باختصار، أدى نجاح DeepSeek إلى زيادة اهتمام الصناعة بمجموعات البيانات المنطقية عالية الجودة. التالي،لقد جمعت HyperAI بعضًا من مجموعات البيانات المنطقية الأكثر شيوعًا لك، والتي تغطي مجالات متعددة مثل الرياضيات والترميز والعلوم والألغاز.بالنسبة للممارسين والباحثين الذين يرغبون في تحسين قدرات التفكير في النماذج الكبيرة بشكل كبير، فإن مجموعات البيانات هذه تشكل بلا شك نقطة بداية ممتازة.
انقر هنا لعرض المزيد من مجموعات البيانات مفتوحة المصدر:
ملخص مجموعة بيانات الاستدلال
1. مجموعة بيانات الاستدلال OpenThoughts-114k
الحجم المقدر:922.07 ميجابايت
عنوان التنزيل:https://go.hyper.ai/SaAit
تم إصدار مجموعة البيانات هذه بواسطة Open Thoughts في عام 2025، مع التركيز على مجالات مثل الرياضيات والبرمجة والعلوم والألغاز، وتحتوي على 114000 عينة عالية الجودة. يهدف إلى تدريب نماذج الاستدلال الصغيرة لتتفوق على النماذج الكبيرة الموجودة (مثل DeepSeek-R1-Distill-Qwen-32B و DeepSeek-R1-Distill-Qwen-7B) في مهام الرياضيات والتفكير البرمجي.
2. مجموعة بيانات مهام الاستدلال Bespoke-Stratos-17k
الحجم المقدر:125 ميجابايت
عنوان التنزيل:https://go.hyper.ai/nLGos
تُعد مجموعة البيانات هذه مجموعة بيانات عالية الجودة مصممة خصيصًا لمهام الاستدلال. ويحتوي على أسئلة ومسارات تفكير وإجابات، تغطي مجالات متعددة مثل البرمجة والرياضيات والألغاز العلمية، ويهدف إلى دعم تدريب نماذج التفكير عالية الأداء. تتكون مجموعة البيانات من 3 أجزاء:
* بيانات البرمجة: 5000 سجل من APPs وTACO * البيانات الرياضية: 10000 سجل من مجموعات AIME وMATH وOlympiads من مجموعة بيانات NuminaMATH
* بيانات العلوم والألغاز: 1000 نقطة بيانات من STILL-2
3. مجموعة بيانات الاستدلال Dolphin-R1
الحجم المقدر:2.24 جيجابايت
عنوان التنزيل:https://go.hyper.ai/grwUo
تحتوي مجموعة بيانات الاستدلال Dolphin-R1 على حوالي 800000 عينة. تتضمن مصادر البيانات 200000 عينة مقدمة من DeepSeek-R1 وGemini Flash وDolphin Chat. ويهدف إلى توفير عينات عالية الجودة لنماذج الاستدلال التدريبي المشابهة لـ DeepSeek-R1. تُستخدم هذه العينات بشكل أساسي لتحسين أداء النموذج في مهام الاستدلال، وتغطية المهام المعقدة مثل الرياضيات والمنطق والترميز.
4. مجموعة بيانات معيار التفكير الرياضي LIMO
الحجم المقدر:4.22 ميجابايت
عنوان التنزيل:https://go.hyper.ai/0p72o
تحتوي مجموعة بيانات معيار التفكير الرياضي LIMO على 817 عينة تفكير رياضي عالية الجودة فقط. ويهدف إلى تدريب وتقييم القدرة على التفكير الرياضي للنماذج الكبيرة من خلال اختيار عينات تدريبية عالية الجودة بعناية. تُستخدم مجموعة البيانات هذه بشكل أساسي لتدريب قدرة النماذج الكبيرة على حل المشكلات الرياضية وتحسين أدائها في الاختبارات الرياضية وأسئلة المنافسة (مثل AIME وMATH-500 وما إلى ذلك).
5. مجموعة بيانات التفكير الرياضي NuminaMath-1.5
الحجم المقدر:446.62 ميجابايت
عنوان التنزيل:https://go.hyper.ai/qVAgO
مجموعة بيانات التفكير الرياضي NuminaMath-1.5 مناسبة لمجالات تعليم الرياضيات ومشاكل المنافسة. يحتوي الكتاب على حوالي 900 ألف مسألة رياضية عالية الجودة على مستوى المنافسة، وحل كل مسألة يكون في صيغة سلسلة الفكر (CoT). هذه المسائل مستمدة من تمارين الرياضيات في المدارس الثانوية الصينية وأسئلة مسابقة أولمبياد الرياضيات الأمريكية والدولية.
6. مجموعة بيانات الاستدلال الرياضي OpenR1-Math-220k
الحجم المقدر:8.44 جيجابايت
عنوان التنزيل:https://go.hyper.ai/nuhSv
OpenR1-Math-220k عبارة عن مجموعة بيانات تفكير رياضي واسعة النطاق أصدرها فريق Open R1 في عام 2025 لسد الفجوة في البيانات الاصطناعية لـ DeepSeek R1. تحتوي مجموعة البيانات على 220,000 مسألة رياضية عالية الجودة ومسارات التفكير الخاصة بها، والتي تم استخلاصها من 800,000 مسار تفكير تم إنشاؤه بواسطة DeepSeek R1.
7. بيانات التقطير الصينية DeepSeek R1
الحجم المقدر:376 ميجابايت
عنوان التنزيل:https://go.hyper.ai/8Podu
هذه المجموعة من البيانات عبارة عن مجموعة بيانات مفتوحة المصدر صينية لدم R1 المقطر بالكامل. لا تحتوي مجموعة البيانات على بيانات الرياضيات فحسب، بل تحتوي أيضًا على كمية كبيرة من البيانات العامة، بإجمالي يصل إلى 110 كيلو بايت. وتشمل هذه:
* الرياضيات: 36,987 عينة
* الامتحان: 2440 عينة
* STEM: 12000 عينة
* عام: 58,573 عينة، بما في ذلك Retarded Bar، وLogical Reasoning، وXiaohongshu، وZhihu، وChat، وما إلى ذلك.
ما ورد أعلاه هو مجموعة بيانات الاستدلال التي تم تجميعها بواسطة HyperAI. إذا كان لديك موارد تريد تضمينها على الموقع الرسمي لـ hyper.ai، فنحن نرحب بك لترك رسالة أو تقديم مساهمة لإخبارنا بها!
حول HyperAI
HyperAI (hyper.ai) هي شركة رائدة في مجال الذكاء الاصطناعي والحوسبة عالية الأداء في الصين.نحن ملتزمون بأن نصبح البنية التحتية في مجال علوم البيانات في الصين وتوفير موارد عامة غنية وعالية الجودة للمطورين المحليين. حتى الآن، لدينا:
* توفير عقد تنزيل محلية سريعة لأكثر من 1200 مجموعة بيانات عامة
* يتضمن أكثر من 300 برنامج تعليمي كلاسيكي وشائع عبر الإنترنت
* تفسير أكثر من 100 حالة بحثية من AI4Science
* دعم البحث عن أكثر من 500 مصطلح ذي صلة
* استضافة أول وثائق كاملة حول Apache TVM باللغة الصينية في الصين
قم بزيارة الموقع الرسمي لبدء رحلة التعلم الخاصة بك: