HyperAIHyperAI

Command Palette

Search for a command to run...

مجموعة بيانات التفضيلات البشرية HPDv3

التاريخ

منذ 6 أشهر

الحجم

16.23 GB

المؤسسة

مختبر الوسائط المتعددة بجامعة هونغ كونغ الصينية (CUHK MMLab)

رابط الورقة البحثية

arxiv.org

الترخيص

MIT

اقترح فريق أبحاث الذكاء الاصطناعي في شركة Mizzen، بالتعاون مع مختبر الوسائط المتعددة (MMLab) التابع للجامعة الصينية في هونغ كونغ، وكلية كينغز كوليدج لندن، وفرق بحثية أخرى، إصدار HPDv3. وقد صدر هذا الإصدار عام ٢٠٢٥، وهو أول مجموعة بيانات شاملة للتفضيلات البشرية في مجالات متعددة. "HPSv3: نحو مقياس تفضيلات بشرية واسع النطاق"، وقد تم اختيارها لـ ICCV 2025. تهدف مجموعة البيانات هذه إلى محاذاة وإعادة ترتيب وتقييم نماذج توليد النص إلى صورة، بهدف تعزيز تقدم النماذج في التعامل مع الجماليات البشرية وتحسين الاتساق الدلالي.

تحتوي مجموعة البيانات على 1.08 مليون زوج من النصوص والصور، و1.17 مليون بيانات مقارنة مُشروحة، تغطي صورًا حقيقية عالية الجودة ومنخفضة الجودة، مع معلومات توضيحية غنية. تحتوي مجموعة التدريب على حوالي 1.14 مليون عنصر، بينما تحتوي مجموعة الاختبار على حوالي 14,400 عنصر، مما يُمكّن من تحديد نطاق واسع من التفضيلات البشرية.

تتضمن البيانات ما يلي:

  • النص: موجه (الإنجليزية)
  • مسارات الصور المقترنة: path1، path2 (محاذية للمسارات بعد فك ضغط حزمة الصورة)
  • مصادر النموذج: النموذج 1، النموذج 2
  • ملاحظة التفضيل: choice_dist (توزيع التصويت، يمكن أن يكون فارغًا)، trust (الثقة، يمكن أن تكون فارغة)
  • الاتفاقية: path1 يتوافق دائمًا مع الصورة المفضلة
مثال لمجموعة البيانات

HPDv3.torrent
البذر 1جارٍ التنزيل 0مكتمل 37إجمالي التنزيلات 155
  • HPDv3/
    • README.md
      1.89 KB
    • README.txt
      3.79 KB
      • data/
        • HPDv3.zip
          16.23 GB

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp