Command Palette
Search for a command to run...
مجموعة بيانات معيارية للاستدلال متعدد المجالات من LoongBench
*تدعم مجموعة البيانات هذه الاستخدام عبر الإنترنت.انقر هنا للقفز.
LoongBench هي مجموعة بيانات تقييم منطقي متعدد المجالات أصدرها فريق CAMEL-AI في عام 2025. نتائج الورقة ذات الصلة هي "لونغ: تجميع سلسلة طويلة من الأفكار على نطاق واسع من خلال أدوات التحقق"، والذي يهدف إلى تزويد برنامج الماجستير في القانون بموارد تدريبية وتقييمية متعددة المجالات وقابلة للتحقق.
تحتوي مجموعة البيانات على 8729 سؤالاً مُعبَّراً عنها بلغة طبيعية، تغطي 12 مجالاً يتطلب تفكيراً منطقياً مكثفاً، مثل الرياضيات المتقدمة، والفيزياء المتقدمة، والكيمياء، وعلم الأحياء الحاسوبي، والبرمجة. لا يقتصر كل نموذج على شيفرة قابلة للتنفيذ وإجابات مُوثَّقة فحسب، بل يتضمن أيضاً بيان المشكلة، وعملية التفكير المفصلة، والحل النهائي، بالإضافة إلى البيانات الوصفية (معرّف السؤال ومعلومات المجال) وعلامات المجال. وهي مناسبة للتدريب وقياس أداء قدرات التفكير المنطقي بين المجالات.

بناء الذكاء الاصطناعي بالذكاء الاصطناعي
من الفكرة إلى الإطلاق — عجّل تطوير الذكاء الاصطناعي الخاص بك من خلال البرمجة المشتركة المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.