HyperAIHyperAI

Command Palette

Search for a command to run...

مجموعة بيانات معيارية للاستدلال متعدد المجالات من LoongBench

التاريخ

منذ 5 أشهر

المؤسسة

كاميل-أي

رابط الورقة البحثية

2509.03059

الترخيص

MIT

LoongBench هي مجموعة بيانات تقييم منطقي متعدد المجالات أصدرها فريق CAMEL-AI في عام 2025. نتائج الورقة ذات الصلة هي "لونغ: تجميع سلسلة طويلة من الأفكار على نطاق واسع من خلال أدوات التحقق"، والذي يهدف إلى تزويد برنامج الماجستير في القانون بموارد تدريبية وتقييمية متعددة المجالات وقابلة للتحقق.

تحتوي مجموعة البيانات على 8729 سؤالاً مُعبَّراً عنها بلغة طبيعية، تغطي 12 مجالاً يتطلب تفكيراً منطقياً مكثفاً، مثل الرياضيات المتقدمة، والفيزياء المتقدمة، والكيمياء، وعلم الأحياء الحاسوبي، والبرمجة. لا يقتصر كل نموذج على شيفرة قابلة للتنفيذ وإجابات مُوثَّقة فحسب، بل يتضمن أيضاً بيان المشكلة، وعملية التفكير المفصلة، والحل النهائي، بالإضافة إلى البيانات الوصفية (معرّف السؤال ومعلومات المجال) وعلامات المجال. وهي مناسبة للتدريب وقياس أداء قدرات التفكير المنطقي بين المجالات.

تكوين مجموعة البيانات

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp