HyperAIHyperAI

Command Palette

Search for a command to run...

مجموعة بيانات معيارية للاستدلال متعدد المجالات من LoongBench

Use this DatasetDiscuss on Discord

Date

منذ 4 أشهر

Organization

كاميل-أي

Paper URL

2509.03059

License

MIT

LoongBench هي مجموعة بيانات تقييم منطقي متعدد المجالات أصدرها فريق CAMEL-AI في عام 2025. نتائج الورقة ذات الصلة هي "لونغ: تجميع سلسلة طويلة من الأفكار على نطاق واسع من خلال أدوات التحقق"، والذي يهدف إلى تزويد برنامج الماجستير في القانون بموارد تدريبية وتقييمية متعددة المجالات وقابلة للتحقق.

تحتوي مجموعة البيانات على 8729 سؤالاً مُعبَّراً عنها بلغة طبيعية، تغطي 12 مجالاً يتطلب تفكيراً منطقياً مكثفاً، مثل الرياضيات المتقدمة، والفيزياء المتقدمة، والكيمياء، وعلم الأحياء الحاسوبي، والبرمجة. لا يقتصر كل نموذج على شيفرة قابلة للتنفيذ وإجابات مُوثَّقة فحسب، بل يتضمن أيضاً بيان المشكلة، وعملية التفكير المفصلة، والحل النهائي، بالإضافة إلى البيانات الوصفية (معرّف السؤال ومعلومات المجال) وعلامات المجال. وهي مناسبة للتدريب وقياس أداء قدرات التفكير المنطقي بين المجالات.

تكوين مجموعة البيانات

Build AI with AI

From idea to launch — accelerate your AI development with free AI co-coding, out-of-the-box environment and best price of GPUs.

AI Co-coding
Ready-to-use GPUs
Best Pricing

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp