HyperAIHyperAI

Command Palette

Search for a command to run...

مجموعة بيانات معايير تقييم مجالات الموضوع SuperGPQA

Discuss on Discord

Date

منذ 10 أشهر

Organization

Paper URL

arxiv.org

License

Apache 2.0

SuperGPQA عبارة عن مجموعة بيانات معيارية لتقييم أداء أنظمة الإجابة على الأسئلة المتقدمة. تم تطويره من قبل فريق عرض الفن المتعدد الوسائط في عام 2025. نتائج الورقة ذات الصلة هي "SuperGPQA: توسيع نطاق تقييم ماجستير القانون عبر 285 تخصصًا للدراسات العليا"تركز مجموعة البيانات هذه على مجال معالجة اللغة الطبيعية وتقييم التعلم الآلي، وتهدف إلى اختبار قدرة النموذج على التفكير ومستوى المعرفة من خلال مشاكل معقدة متعددة التخصصات.

تغطي مجموعة البيانات 285 مجالًا دراسيًا على مستوى الدراسات العليا مع أنواع مختلفة من الأسئلة، بما في ذلك علم الأحياء والفيزياء والكيمياء وغيرها من المجالات العلمية.

Build AI with AI

From idea to launch — accelerate your AI development with free AI co-coding, out-of-the-box environment and best price of GPUs.

AI Co-coding
Ready-to-use GPUs
Best Pricing

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp
مجموعة بيانات معايير تقييم مجالات الموضوع SuperGPQA | Datasets | HyperAI