مجموعة بيانات معيارية للتقييم التلقائي للصور DreamBench++
التاريخ
منذ عام واحد
الحجم
1.68 GB
رابط النشر
العلامات

DreamBench++ هو معيار جديد تم إطلاقه بشكل مشترك في عام 2024 من قبل باحثين من جامعة تسينغهوا، وجامعة شيان جياوتونغ، وجامعة إلينوي في أوربانا شامبين، والأكاديمية الصينية للعلوم، وشركة Megvii لمعالجة المشكلات في تقييم تقنية إنشاء الصور الشخصية. ويحقق التوافق العميق والتقييم الآلي مع التفضيلات البشرية من خلال تقديم GPT-4o المتعدد الوسائط، ويطلق مجموعة بيانات أكثر شمولاً وتنوعًا.
تتضمن الميزات الرئيسية لـ DreamBench++ ما يلي:
- التقييم الآلي:استخدم GPT-4o للتقييم الآلي، مما يقلل من الوقت وتكلفة التقييم اليدوي.
- محاذاة التفضيلات البشرية:من خلال تصميم مطالبات مصممة بعناية، يمكن لـ GPT-4o التفكير مثل الإنسان أثناء عملية التقييم، مما يضمن أن تكون نتائج التقييم متسقة مع الحدس والتفضيلات البشرية.
- مجموعة بيانات شاملة:تم إنشاء مجموعة بيانات مخصصة تحتوي على 200 كلمة رئيسية، تغطي ثلاثة أنواع من الصور: الأشياء، والكائنات الحية، والصور المنمقة. وشملت مصادر الصور Unsplash، وRawpixel، وGoogle Image Search. تم اختيار الصور ذات الخلفيات النظيفة ونسب الموضوعات الكبيرة لتحسين وضوح الصورة والتعرف عليها.
- النتائج التجريبيةتم تقييم سبع طرق مختلفة لتوليد الصور، وأظهرت النتائج أن درجات DreamBench++ في تشابه الصور والالتزام بالنص كانت متسقة للغاية مع التقييمات البشرية، حيث وصل الاتساق إلى 79.64% و93.18% على التوالي، وهو أعلى من درجة DINO الحالية ودرجة CLIP بأكثر من 50%.
يوفر إطلاق DreamBench++ أدوات وطرق جديدة لتقييم تقنية إنشاء الصور المخصصة، مما سيساعد في تعزيز المزيد من التطوير في هذا المجال. وقد تم نشر الأوراق ومجموعات البيانات ذات الصلة ليستخدمها الباحثون والمطورون ويعودوا إليها.
DreamBench++.torrent
البذر 2التنزيل 1مكتمل 67إجمالي التنزيلات 77