مجموعة بيانات صور DreamBooth
التاريخ
الحجم
رابط النشر
العلامات
الفئات

مجموعة بيانات DreamBooth عبارة عن مجموعة بيانات لتدريب نماذج الانتشار للتعرف على صور أفراد محددين وتوليدها. إنه يسمح بتدريب النموذج باستخدام عدد صغير من الصور (على سبيل المثال، بضع صور لكائن أو شخص معين) لتوليد صور لهذا الفرد المعين في العديد من السياقات المختلفة مع الحفاظ على ميزاته المرئية الرئيسية.
تحتوي مجموعة البيانات على 30 موضوعًا من فئات مختلفة، بما في ذلك 9 كائنات حية (مثل الكلاب والقطط) و21 كائنًا، مع 4 إلى 6 صور لكل موضوع. يتم التقاط هذه الصور عادة في ظروف وبيئات وزوايا مختلفة للتأكد من أن النموذج يمكنه تعلم مظهر الموضوع في سياقات مختلفة.
- تتضمن مجموعة البيانات أيضًا ملفًا
prompts_and_classes.txt
، والذي يحتوي على جميع المطالبات المستخدمة للموضوعات والأشياء الحية في الورقة، بالإضافة إلى أسماء الفئات المستخدمة للموضوعات. - تم التقاط هذه الصور إما بواسطة مؤلفي البحث أو من موقع www.unsplash.com.
- يجب
references_and_licenses.txt
يحتوي الملف على قائمة روابط مرجعية لجميع الصور على www.unsplash.com، بالإضافة إلى الإسناد إلى المصور وترخيص الصور.
هذه المجموعة من البيانات مأخوذة من ورقة جوجلDreamBooth: ضبط نماذج انتشار النص إلى صورة بدقة من أجل توليد محتوى موجه نحو الموضوع"يعتبر جزءًا من المستودع الرسمي للورقة البحثية، وقد تم نشر نتائج الورقة البحثية في CVPR 2023.