مجموعة بيانات التفضيلات البشرية HPDv3
التاريخ
الحجم
رابط النشر
رابط الورقة البحثية
الترخيص
MIT
اقترح فريق أبحاث الذكاء الاصطناعي في شركة Mizzen، بالتعاون مع مختبر الوسائط المتعددة (MMLab) التابع للجامعة الصينية في هونغ كونغ، وكلية كينغز كوليدج لندن، وفرق بحثية أخرى، إصدار HPDv3. وقد صدر هذا الإصدار عام ٢٠٢٥، وهو أول مجموعة بيانات شاملة للتفضيلات البشرية في مجالات متعددة. "HPSv3: نحو مقياس تفضيلات بشرية واسع النطاق"، وقد تم اختيارها لـ ICCV 2025. تهدف مجموعة البيانات هذه إلى محاذاة وإعادة ترتيب وتقييم نماذج توليد النص إلى صورة، بهدف تعزيز تقدم النماذج في التعامل مع الجماليات البشرية وتحسين الاتساق الدلالي.
تحتوي مجموعة البيانات على 1.08 مليون زوج من النصوص والصور، و1.17 مليون بيانات مقارنة مُشروحة، تغطي صورًا حقيقية عالية الجودة ومنخفضة الجودة، مع معلومات توضيحية غنية. تحتوي مجموعة التدريب على حوالي 1.14 مليون عنصر، بينما تحتوي مجموعة الاختبار على حوالي 14,400 عنصر، مما يُمكّن من تحديد نطاق واسع من التفضيلات البشرية.
تتضمن البيانات ما يلي:
- النص: موجه (الإنجليزية)
- مسارات الصور المقترنة: path1، path2 (محاذية للمسارات بعد فك ضغط حزمة الصورة)
- مصادر النموذج: النموذج 1، النموذج 2
- ملاحظة التفضيل: choice_dist (توزيع التصويت، يمكن أن يكون فارغًا)، trust (الثقة، يمكن أن تكون فارغة)
- الاتفاقية: path1 يتوافق دائمًا مع الصورة المفضلة
