مجموعة بيانات INFINITY-CHAT للإجابة على الأسئلة المفتوحة الحقيقية
التاريخ
رابط الورقة
تُعدّ مجموعة بيانات INFINITY-CHAT، التي أطلقتها جامعة واشنطن عام 2025 بالتعاون مع جامعة كارنيجي ميلون ومعهد ألين للذكاء الاصطناعي ومؤسسات أخرى، أول مجموعة بيانات واسعة النطاق تُجيب على أسئلة مفتوحة من مستخدمين حقيقيين. وتتضمن أبحاثها ذات الصلة... العقل الجمعي الاصطناعي: التجانس المفتوح لنماذج اللغة (وما وراءه) حصلت هذه الورقة البحثية على جائزة أفضل ورقة بحثية في مؤتمر NeurIPS 2025 (مسار قاعدة البيانات)، وتهدف إلى دراسة القضايا الرئيسية بشكل منهجي مثل تنوع نماذج اللغة في التوليد المفتوح، والاختلافات في التفضيلات البشرية، و"تأثير السرب الاصطناعي".
تحتوي هذه المجموعة من البيانات على أكثر من 26,000 سؤال مفتوح حقيقي من المستخدمين، وتوفر نظامًا شاملاً لتصنيف الاستفسارات بست فئات رئيسية و17 فئة فرعية. كما تتضمن إجابات من أكثر من 70 نموذجًا لغويًا و31,250 تعليقًا بشريًا (بما في ذلك الدرجات المطلقة والتفضيلات الثنائية)، بمتوسط 25 معلقًا يُقيّمون كل عينة. تتكون المجموعة من أربعة أجزاء رئيسية: مجموعة الأسئلة المفتوحة، وتصنيفات متعددة المستويات، ونتائج النماذج، وتعليقات بشرية واسعة النطاق.
بناء الذكاء الاصطناعي بالذكاء الاصطناعي
من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.