Command Palette
Search for a command to run...
مجموعة بيانات الأسئلة غير المحلولة لجامعة كوينزلاند
التاريخ
رابط الورقة البحثية
الترخيص
CC BY-SA 4.0
*تدعم مجموعة البيانات هذه الاستخدام عبر الإنترنت.انقر هنا للقفز.
مجموعة بيانات جامعة كوينزلاند هي معيار تقييمي أصدرته جامعة ستانفورد، وجامعة واشنطن، وجامعة نورث كارولينا، ومؤسسات أخرى في عام ٢٠٢٥. نتائج البحث ذات الصلة هي:جامعة كوينزلاند: تقييم نماذج اللغة على الأسئلة غير المحلولة"، والذي يهدف إلى تقييم قدرات التفكير والواقعية والتصفح للنماذج الكبيرة المتطورة من خلال استخدام "مشاكل حقيقية وصعبة لم يتم الإجابة عليها من قبل المجتمع البشري".
تتكون مجموعة البيانات من 500 سؤال قديم لم تتم الإجابة عليها من منصة Stack Exchange، وتغطي مواضيع مثل نظرية علوم الحاسوب، والرياضيات، والخيال العلمي، والتاريخ. تعتمد المجموعة على آلية تجميع "تصفية القواعد + مراجعة ماجستير القانون + مراجعة يدوية"، وهي مزودة بأجهزة UQ-Validators للفرز المسبق التلقائي ومراجعة المجتمع لإجابات المرشحين. تتميز المجموعة بصعوبة تطبيقها، وإن كانت واقعية، وتقييمها غير المتزامن، وفصلها بين التوليد والتحقق. وهي مناسبة لسيناريوهات مثل تقييم الاستدلال/الاسترجاع للنماذج المتطورة، وتتبع التقدم طويل المدى، والتصنيفات العامة.
توزيع البيانات:
- العلوم: 395
- التكنولوجيا: 52
- الثقافة والترفيه: 16
- الحياة والفنون: 35

بناء الذكاء الاصطناعي بالذكاء الاصطناعي
من الفكرة إلى الإطلاق — عجّل تطوير الذكاء الاصطناعي الخاص بك من خلال البرمجة المشتركة المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.