HyperAIHyperAI

Command Palette

Search for a command to run...

مجموعة بيانات الأسئلة غير المحلولة لجامعة كوينزلاند

Use this DatasetDiscuss on Discord

Date

منذ 4 أشهر

Organization

جامعة ستانفورد
جامعة واشنطن

Paper URL

2508.17580

License

CC BY-SA 4.0

مجموعة بيانات جامعة كوينزلاند هي معيار تقييمي أصدرته جامعة ستانفورد، وجامعة واشنطن، وجامعة نورث كارولينا، ومؤسسات أخرى في عام ٢٠٢٥. نتائج البحث ذات الصلة هي:جامعة كوينزلاند: تقييم نماذج اللغة على الأسئلة غير المحلولة"، والذي يهدف إلى تقييم قدرات التفكير والواقعية والتصفح للنماذج الكبيرة المتطورة من خلال استخدام "مشاكل حقيقية وصعبة لم يتم الإجابة عليها من قبل المجتمع البشري".

تتكون مجموعة البيانات من 500 سؤال قديم لم تتم الإجابة عليها من منصة Stack Exchange، وتغطي مواضيع مثل نظرية علوم الحاسوب، والرياضيات، والخيال العلمي، والتاريخ. تعتمد المجموعة على آلية تجميع "تصفية القواعد + مراجعة ماجستير القانون + مراجعة يدوية"، وهي مزودة بأجهزة UQ-Validators للفرز المسبق التلقائي ومراجعة المجتمع لإجابات المرشحين. تتميز المجموعة بصعوبة تطبيقها، وإن كانت واقعية، وتقييمها غير المتزامن، وفصلها بين التوليد والتحقق. وهي مناسبة لسيناريوهات مثل تقييم الاستدلال/الاسترجاع للنماذج المتطورة، وتتبع التقدم طويل المدى، والتصنيفات العامة.

توزيع البيانات:

  • العلوم: 395
  • التكنولوجيا: 52
  • الثقافة والترفيه: 16
  • الحياة والفنون: 35
عملية بناء مجموعة البيانات

Build AI with AI

From idea to launch — accelerate your AI development with free AI co-coding, out-of-the-box environment and best price of GPUs.

AI Co-coding
Ready-to-use GPUs
Best Pricing

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp