Command Palette
Search for a command to run...
مجموعة من 7 مجموعات بيانات رئيسية للمنطق الرياضي، تغطي المنطق الحسابي/المنطق الرمزي/الرياضيات البصرية/التحليل الهندسي

مع التقدم السريع في قدرات النماذج واسعة النطاق، يتطور التفكير الرياضي من نشاط فكري بشري فريد إلى أحد أكثر مجالات الذكاء الاصطناعي تحديًا. المهام التي كانت تعتمد في السابق على العقلانية البشرية، مثل الاستنتاج المنطقي، وحساب الصيغ، والتفكير متعدد الخطوات، أصبحت الآن تُفهم وتُتعلم تدريجيًا بواسطة الآلات.ومع ذلك، وعلى عكس فهم اللغة أو التعرف على الصور، يتطلب التفكير الرياضي من النموذج ليس فقط فهم المعنى السطحي للسؤال، بل أيضًا الحصول على نظرة ثاقبة للهيكل المنطقي وراءه، مما يجعل أداء النموذج يعتمد بشكل خاص على جودة البيانات.
يتطلب تطوير النماذج من "الحساب" إلى "الاستدلال" دعم بيانات عالية الجودة، منظمة، ومتماسكة منطقيًا. فمجموعة البيانات المنهجية والهرمية والمتماسكة منطقيًا لا تحدد فقط قدرة النموذج على استيعاب مبادئ الاستدلال الكامنة وراء الرموز المجردة، بل تؤثر أيضًا على قدرته على التعميم والتصحيح الذاتي في البيئات المفتوحة.بالمقارنة مع مجموعات اللغة الطبيعية العامة، فإن مجموعات بيانات التفكير الرياضي تضع المزيد من التركيز على تنوع توزيع المشكلات، وإمكانية تفسير مسارات حل المشكلات، والشرح الكامل لسلاسل التفكير، مما يضمن أن تكون عملية التعلم في النموذج قريبة قدر الإمكان من التفكير البشري.
إجمالي،لقد أصبح التفكير الرياضي بمثابة نافذة رئيسية للذكاء الاصطناعي للتحرك نحو "الذكاء القابل للتفسير".لتعزيز البحث والتطبيق في هذا المجال، جمعت HyperAI سلسلة من مجموعات البيانات المتعلقة بالمنطق الرياضي من المؤسسات والشركات الرائدة في جميع أنحاء العالم، بما في ذلك جامعة تشجيانغ، وجامعة هونج كونج، وNVIDIA، وOpenAI، وAlibaba، والتي تغطي مجالات متعددة بما في ذلك الرياضيات البصرية والتحليل الهندسي.
انقر هنا لعرض المزيد من مجموعات البيانات مفتوحة المصدر:
ملخص مجموعة بيانات التفكير الرياضي
1. مجموعة بيانات We-Math2.0 المعيارية
الحجم المقدر:369.86 ميجابايت
عنوان التنزيل:https://go.hyper.ai/1dAZ2
معيار We-Math2.0 هو مجموعة بيانات قياسية للتفكير الرياضي البصري، أصدرتها جامعة بكين للبريد والاتصالات، وتينسنت، وجامعة تسينغهوا عام ٢٠٢٥. عنوان الورقة البحثية ذات الصلة هو "WE-MATH 2.0: نظام كتب الرياضيات متعدد الاستخدامات لتحفيز التفكير الرياضي البصري". تهدف الورقة إلى توفير أساس تقييمي قابل للتشخيص والتفسير والمقارنة.
عنوان الورقة:
https://hyper.ai/en/papers/2508.10433
تُنشئ هذه المجموعة من البيانات مساحة تصنيف موحدة حول 1819 مبدأ معرفي مُعرّف بدقة، مع شرح واضح لكل سؤال بالمبدأ ومراجعته بدقة، مما يُحقق تغطية شاملة ومتوازنة، ويعزز بشكل خاص المجالات الفرعية الرياضية وأنواع الأسئلة التي كانت مُمثلة تمثيلاً ناقصاً في السابق. تعتمد مجموعة البيانات تصميم توسع مزدوج:
* أولاً، يتم استخدام صور متعددة لكل سؤال لاختبار تكامل ومواءمة الأدلة البصرية متعددة المصادر؛
* ثانيًا، يتم استخدام أسئلة متعددة لكل صورة لاختبار نقل المبادئ المتعددة والمرونة المفاهيمية في نفس السياق البصري.
يتكون كل مثال من صورة وجذع نص، ويصاحبه تعليقات على مبادئ المعرفة والإجابات القياسية التي يعتمد عليها السؤال.
2. مجموعة بيانات مسائل الرياضيات NuminaMath-LEAN
الحجم المقدر:65.06 ميجابايت
عنوان التنزيل:https://go.hyper.ai/BfJFv
NuminaMath-LEAN هي مجموعة بيانات لمسائل رياضية، أصدرتها Numina وفريق Kimi بشكل مشترك عام ٢٠٢٥. الورقة البحثية ذات الصلة هي "معاينة مُثبِّتات Kimina: نحو نماذج استدلال شكلية كبيرة مع التعلم التعزيزي". تهدف هذه الورقة إلى توفير عبارات شكلية مُعلَّقة يدويًا وبراهين لتدريب وتقييم نماذج إثبات النظريات الآلية.
عنوان الورقة:
https://hyper.ai/en/papers/2504.11354
تحتوي هذه المجموعة من البيانات على 100,000 مسألة رياضية، بما في ذلك مسائل من مسابقات معتمدة مثل أولمبياد الرياضيات الدولي (IMO) وأولمبياد الرياضيات الأمريكي (USAMO). تتضمن أنواع البيانات عبارات المسائل، وتصنيفات أنواع الأسئلة، والإجابات، والمصادر، والبراهين الرسمية، ومعلومات المُعلّق، وسجلات عملية تدريب التعلم المُعزّز.
3. مجموعة بيانات SFT الروسية T-Wix
الحجم المقدر:1.43 جيجابايت
عنوان التنزيل:https://go.hyper.ai/5XULu
T-Wix هي مجموعة بيانات SFT روسية. الورقة البحثية ذات الصلة بعنوان "من الكم إلى الكيف: تعزيز أداء ماجستير الحقوق من خلال اختيار البيانات ذاتي التوجيه لضبط التعليمات"، تهدف إلى تعزيز قدرة النموذج على حل المشكلات الخوارزمية والرياضية، وتنمية الحوار والتفكير المنطقي وأنماط الاستدلال.
عنوان الورقة:
https://arxiv.org/abs/2308.12032
تحتوي مجموعة البيانات على 499,598 عينة باللغة الروسية، منها 468,614 عينة عامة تغطي مجالات متنوعة، مثل الرياضيات والعلوم والبرمجة والمعرفة العامة واتباع التعليمات وتقمص الأدوار. أما عينات الاستدلال، فتضم 30,984 نقطة بيانات، تركز على مسائل الرياضيات والعلوم المتقدمة، وتوفر مسارات استدلالية مفصلة.
4. مجموعة بيانات الاستدلال الرياضي Nemotron-Math-HumanReasoning
الحجم المقدر:639.91 كيلوبايت
عنوان التنزيل:https://go.hyper.ai/28kjP
Nemotron-Math-HumanReasoning هي مجموعة بيانات استدلال رياضي أصدرتها شركة NVIDIA في عام 2025. وكانت نتيجة البحث ذات الصلة هي "تحدي تدريس الاستدلال لطلاب الماجستير في القانون دون الحاجة إلى التعلم التعزيزي أو التقطير"، والتي تهدف إلى محاكاة أسلوب الاستدلال الموسع لنماذج مثل DeepSeek-R1.
عنوان الورقة:
https://arxiv.org/abs/2507.09850
تحتوي مجموعة البيانات على 50 مسألة رياضية من مجموعة بيانات OpenMathReasoning، و200 حل مكتوب بواسطة الإنسان، و50 حلاً إضافيًا تم إنشاؤها بواسطة QwQ-32B-Preview.
5. مجموعة بيانات Open-Omega-Atom-1.5M
الحجم المقدر:6.6 جيجابايت
عنوان التنزيل:https://go.hyper.ai/bndWW
Open-Omega-Atom-1.5M عبارة عن مجموعة بيانات استدلالية في الرياضيات والعلوم مصممة لتعزيز قدرات الاستدلال في الرياضيات والعلوم.
تحتوي مجموعة البيانات على حوالي 1.5 مليون بيانات وهي مصممة لتطبيقات الرياضيات والعلوم والبرمجة، حيث تشكل البيانات الرياضية جزءًا مهمًا من تكوينها.
ميزات مجموعة البيانات:
* موجز وعالي الجودة: التركيز على المشاكل الواضحة والتحديات والحلول خطوة بخطوة.
* التركيز على العلوم والتكنولوجيا والهندسة والرياضيات: دمج الرياضيات والتفكير البرمجي والتفكير العلمي مع تخصص الرياضيات.
* تم تنظيمها وتحسينها: يتم الحصول على البيانات بشكل انتقائي من مجموعات البيانات المفتوحة عالية الجودة والبيانات المخصصة لتحقيق التنوع والترابط الأمثل.
* مناسب للاستدلال: يتمتع بتغطية قوية لحل المشكلات القائمة على الخطوات والمنطق، ويمكن أن يكون بمثابة معيار لمحركات الاستدلال.
6. مجموعة بيانات الاستدلال الرياضي GSM8K
الحجم المقدر:4.92 ميجابايت
عنوان التنزيل:https://go.hyper.ai/d9PZh
GSM8K هي مجموعة بيانات استدلال رياضي أصدرتها شركة OpenAI في عام 2022. نتائج البحث ذات الصلة هي: "تدريب المحققين لحل مسائل الكلمات الرياضية"، والتي تهدف إلى تحسين أداء نماذج التعلم الآلي في فهم وحل المسائل الرياضية المعقدة.
عنوان الورقة:
https://arxiv.org/abs/2110.14168
تحتوي هذه المجموعة من البيانات على 8.5 ألف مسألة رياضية لفظية عالية الجودة للمرحلة الابتدائية، بلغات متنوعة، تغطي الجبر والحساب والهندسة ومجالات أخرى. تتراوح خطوات حل المسألة بين خطوتين وثماني خطوات. يتضمن الحل بشكل أساسي سلسلة من العمليات الحسابية البسيطة باستخدام العمليات الحسابية الأساسية (+ − × ÷) للحصول على الإجابة النهائية.
7. مجموعة بيانات معيار التفكير الرياضي VCBench
الحجم المقدر:86.04 ميجابايت
عنوان التنزيل:https://hyper.ai/cn/datasets/43960
VCBench هي مجموعة بيانات مرجعية لتقييم التفكير الرياضي المتعدد الوسائط مع التبعيات البصرية الصريحة، أصدرتها شركة Alibaba وجامعة Zhejiang في عام 2025. تحتوي مجموعة البيانات على 1720 زوجًا من الأسئلة والأجوبة وإجمالي 6697 صورة.
تتضمن الأسئلة بشكل رئيسي المجالات الستة التالية:
* الوقت والتقويم: يختبر أسئلة الاستدلال الزمني عبر فئتين فرعيتين (التقويم والساعة)، ويتطلب فهم فترات الوقت والحسابات القائمة على التقويم.
* المساحة والموقع: تركز التحديات على التفكير المكاني عبر ثلاث فئات فرعية (الاتجاه، والموقع، والمكان) لتقييم فهم الموقع النسبي، والاتجاه، والعلاقات المكانية.
* الهندسة والأشكال: أسئلة تغطي خمس فئات فرعية (الزوايا، والأشكال الرباعية، والمستطيلات، والأشكال، والمثلثات) تختبر الفهم الهندسي الأساسي، من التعرف على الأشكال الأساسية إلى تحليل الخصائص الأكثر تعقيدًا.
* الأشياء والحركة: المهام في فئتين فرعيتين (المكعب والحركة) تقيم فهم الأشياء ثلاثية الأبعاد وتحويلات الحركة.
* الاستدلال والملاحظة: تم تصميم الأسئلة في كلا الفئتين الفرعيتين (الاستدلال والملاحظة) لاختبار مهارات الاستدلال المنطقي والملاحظة البصرية الدقيقة.
* التنظيم والأنماط: تقوم التحديات عبر ثلاث فئات فرعية (التنظيم والأنماط والترجيح) بتقييم التعرف على الأنماط والتسلسل والمنطق التنظيمي.
ما سبق هو ملخص لمجموعات البيانات الموصى بها في هذا العدد. تفضل بتحميلها بنقرة واحدة.