HyperAIHyperAI

Command Palette

Search for a command to run...

مجموعة بيانات الأسئلة غير المحلولة لجامعة كوينزلاند

التاريخ

منذ 2 أشهر

المؤسسة

جامعة ستانفورد
جامعة واشنطن

رابط الورقة البحثية

2508.17580

الترخيص

CC BY-SA 4.0

انضم إلى مجتمع Discord

*تدعم مجموعة البيانات هذه الاستخدام عبر الإنترنت.انقر هنا للقفز.

مجموعة بيانات جامعة كوينزلاند هي معيار تقييمي أصدرته جامعة ستانفورد، وجامعة واشنطن، وجامعة نورث كارولينا، ومؤسسات أخرى في عام ٢٠٢٥. نتائج البحث ذات الصلة هي:جامعة كوينزلاند: تقييم نماذج اللغة على الأسئلة غير المحلولة"، والذي يهدف إلى تقييم قدرات التفكير والواقعية والتصفح للنماذج الكبيرة المتطورة من خلال استخدام "مشاكل حقيقية وصعبة لم يتم الإجابة عليها من قبل المجتمع البشري".

تتكون مجموعة البيانات من 500 سؤال قديم لم تتم الإجابة عليها من منصة Stack Exchange، وتغطي مواضيع مثل نظرية علوم الحاسوب، والرياضيات، والخيال العلمي، والتاريخ. تعتمد المجموعة على آلية تجميع "تصفية القواعد + مراجعة ماجستير القانون + مراجعة يدوية"، وهي مزودة بأجهزة UQ-Validators للفرز المسبق التلقائي ومراجعة المجتمع لإجابات المرشحين. تتميز المجموعة بصعوبة تطبيقها، وإن كانت واقعية، وتقييمها غير المتزامن، وفصلها بين التوليد والتحقق. وهي مناسبة لسيناريوهات مثل تقييم الاستدلال/الاسترجاع للنماذج المتطورة، وتتبع التقدم طويل المدى، والتصنيفات العامة.

توزيع البيانات:

  • العلوم: 395
  • التكنولوجيا: 52
  • الثقافة والترفيه: 16
  • الحياة والفنون: 35
عملية بناء مجموعة البيانات

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — عجّل تطوير الذكاء الاصطناعي الخاص بك من خلال البرمجة المشتركة المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة المشتركة بالذكاء الاصطناعي
وحدات معالجة رسومات جاهزة
أفضل الأسعار
ابدأ الآن

Hyper Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp
مجموعة بيانات الأسئلة غير المحلولة لجامعة كوينزلاند | مجموعات البيانات | HyperAI