Command Palette
Search for a command to run...
مجموعة بيانات الأسئلة غير المحلولة لجامعة كوينزلاند
Date
Paper URL
License
CC BY-SA 4.0
مجموعة بيانات جامعة كوينزلاند هي معيار تقييمي أصدرته جامعة ستانفورد، وجامعة واشنطن، وجامعة نورث كارولينا، ومؤسسات أخرى في عام ٢٠٢٥. نتائج البحث ذات الصلة هي:جامعة كوينزلاند: تقييم نماذج اللغة على الأسئلة غير المحلولة"، والذي يهدف إلى تقييم قدرات التفكير والواقعية والتصفح للنماذج الكبيرة المتطورة من خلال استخدام "مشاكل حقيقية وصعبة لم يتم الإجابة عليها من قبل المجتمع البشري".
تتكون مجموعة البيانات من 500 سؤال قديم لم تتم الإجابة عليها من منصة Stack Exchange، وتغطي مواضيع مثل نظرية علوم الحاسوب، والرياضيات، والخيال العلمي، والتاريخ. تعتمد المجموعة على آلية تجميع "تصفية القواعد + مراجعة ماجستير القانون + مراجعة يدوية"، وهي مزودة بأجهزة UQ-Validators للفرز المسبق التلقائي ومراجعة المجتمع لإجابات المرشحين. تتميز المجموعة بصعوبة تطبيقها، وإن كانت واقعية، وتقييمها غير المتزامن، وفصلها بين التوليد والتحقق. وهي مناسبة لسيناريوهات مثل تقييم الاستدلال/الاسترجاع للنماذج المتطورة، وتتبع التقدم طويل المدى، والتصنيفات العامة.
توزيع البيانات:
- العلوم: 395
- التكنولوجيا: 52
- الثقافة والترفيه: 16
- الحياة والفنون: 35

Build AI with AI
From idea to launch — accelerate your AI development with free AI co-coding, out-of-the-box environment and best price of GPUs.