HyperAIHyperAI

Command Palette

Search for a command to run...

مجموعة بيانات معيارية للاستدلال متعدد المجالات من LoongBench

التاريخ

منذ 2 أشهر

المؤسسة

كاميل-أي

رابط الورقة البحثية

2509.03059

الترخيص

MIT

انضم إلى مجتمع Discord

*تدعم مجموعة البيانات هذه الاستخدام عبر الإنترنت.انقر هنا للقفز.

LoongBench هي مجموعة بيانات تقييم منطقي متعدد المجالات أصدرها فريق CAMEL-AI في عام 2025. نتائج الورقة ذات الصلة هي "لونغ: تجميع سلسلة طويلة من الأفكار على نطاق واسع من خلال أدوات التحقق"، والذي يهدف إلى تزويد برنامج الماجستير في القانون بموارد تدريبية وتقييمية متعددة المجالات وقابلة للتحقق.

تحتوي مجموعة البيانات على 8729 سؤالاً مُعبَّراً عنها بلغة طبيعية، تغطي 12 مجالاً يتطلب تفكيراً منطقياً مكثفاً، مثل الرياضيات المتقدمة، والفيزياء المتقدمة، والكيمياء، وعلم الأحياء الحاسوبي، والبرمجة. لا يقتصر كل نموذج على شيفرة قابلة للتنفيذ وإجابات مُوثَّقة فحسب، بل يتضمن أيضاً بيان المشكلة، وعملية التفكير المفصلة، والحل النهائي، بالإضافة إلى البيانات الوصفية (معرّف السؤال ومعلومات المجال) وعلامات المجال. وهي مناسبة للتدريب وقياس أداء قدرات التفكير المنطقي بين المجالات.

تكوين مجموعة البيانات

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — عجّل تطوير الذكاء الاصطناعي الخاص بك من خلال البرمجة المشتركة المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة المشتركة بالذكاء الاصطناعي
وحدات معالجة رسومات جاهزة
أفضل الأسعار
ابدأ الآن

Hyper Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp
مجموعة بيانات معيارية للاستدلال متعدد المجالات من LoongBench | مجموعات البيانات | HyperAI