HyperAIHyperAI

Command Palette

Search for a command to run...

مجموعة بيانات التفضيلات البشرية HPDv3

التاريخ

منذ 3 أشهر

الحجم

16.23 GB

المؤسسة

مختبر الوسائط المتعددة بجامعة هونغ كونغ الصينية (CUHK MMLab)

رابط الورقة البحثية

arxiv.org

الترخيص

MIT

اقترح فريق أبحاث الذكاء الاصطناعي في شركة Mizzen، بالتعاون مع مختبر الوسائط المتعددة (MMLab) التابع للجامعة الصينية في هونغ كونغ، وكلية كينغز كوليدج لندن، وفرق بحثية أخرى، إصدار HPDv3. وقد صدر هذا الإصدار عام ٢٠٢٥، وهو أول مجموعة بيانات شاملة للتفضيلات البشرية في مجالات متعددة. "HPSv3: نحو مقياس تفضيلات بشرية واسع النطاق"، وقد تم اختيارها لـ ICCV 2025. تهدف مجموعة البيانات هذه إلى محاذاة وإعادة ترتيب وتقييم نماذج توليد النص إلى صورة، بهدف تعزيز تقدم النماذج في التعامل مع الجماليات البشرية وتحسين الاتساق الدلالي.

تحتوي مجموعة البيانات على 1.08 مليون زوج من النصوص والصور، و1.17 مليون بيانات مقارنة مُشروحة، تغطي صورًا حقيقية عالية الجودة ومنخفضة الجودة، مع معلومات توضيحية غنية. تحتوي مجموعة التدريب على حوالي 1.14 مليون عنصر، بينما تحتوي مجموعة الاختبار على حوالي 14,400 عنصر، مما يُمكّن من تحديد نطاق واسع من التفضيلات البشرية.

تتضمن البيانات ما يلي:

  • النص: موجه (الإنجليزية)
  • مسارات الصور المقترنة: path1، path2 (محاذية للمسارات بعد فك ضغط حزمة الصورة)
  • مصادر النموذج: النموذج 1، النموذج 2
  • ملاحظة التفضيل: choice_dist (توزيع التصويت، يمكن أن يكون فارغًا)، trust (الثقة، يمكن أن تكون فارغة)
  • الاتفاقية: path1 يتوافق دائمًا مع الصورة المفضلة
مثال لمجموعة البيانات

HPDv3.torrent
البذر 1التنزيل 0مكتمل 23إجمالي التنزيلات 109
  • HPDv3/
    • README.md
      1.89 KB
    • README.txt
      3.79 KB
      • data/
        • HPDv3.zip
          16.23 GB

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — عجّل تطوير الذكاء الاصطناعي الخاص بك من خلال البرمجة المشتركة المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة المشتركة بالذكاء الاصطناعي
وحدات معالجة رسومات جاهزة
أفضل الأسعار
ابدأ الآن

Hyper Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp