استخدم مجموعة البيانات هذه ناقش على Discord

التاريخ

منذ 10 أشهر

المؤسسة

رابط الورقة البحثية

2509.03059

الترخيص

MIT

الوسوم

الاستدلال

المعايير

LoongBench هي مجموعة بيانات تقييم منطقي متعدد المجالات أصدرها فريق CAMEL-AI في عام 2025. نتائج الورقة ذات الصلة هي "لونغ: تجميع سلسلة طويلة من الأفكار على نطاق واسع من خلال أدوات التحقق"، والذي يهدف إلى تزويد برنامج الماجستير في القانون بموارد تدريبية وتقييمية متعددة المجالات وقابلة للتحقق. تحتوي مجموعة البيانات على 8729 سؤالاً مُعبَّراً عنها بلغة طبيعية، تغطي 12 مجالاً يتطلب تفكيراً منطقياً مكثفاً، مثل الرياضيات المتقدمة، والفيزياء المتقدمة، والكيمياء، وعلم الأحياء الحاسوبي، والبرمجة. لا يقتصر كل نموذج على شيفرة قابلة للتنفيذ وإجابات مُوثَّقة فحسب، بل يتضمن أيضاً بيان المشكلة، وعملية التفكير المفصلة، والحل النهائي، بالإضافة إلى البيانات الوصفية (معرّف السؤال ومعلومات المجال) وعلامات المجال. وهي مناسبة للتدريب وقياس أداء قدرات التفكير المنطقي بين المجالات.

تم المساهمة بهذه المجموعة من البيانات من قبل مستخدمي المجتمع وهي مخصصة للأغراض التعليمية والإعلامية فقط. إذا كان أي محتوى ينطوي على انتهاك لحقوق النشر، يرجى الاتصال بنا على [email protected] للمراجعة والإزالة الفورية.

مجموعات البيانات ذات الصلة

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي

وحدات GPU جاهزة للعمل

أفضل الأسعار

ابدأ عرض الأسعار