مجموعة بيانات Unsplash Lite نسخة مبسطة من مجموعة بيانات استرجاع الصور
التاريخ
الحجم
رابط النشر
الترخيص
其他
يعد موقع Unsplash أحد أكبر مواقع التصوير الفوتوغرافي في العالم، حيث يضم أكثر من 200 ألف مصور من جميع أنحاء العالم يساهمون بملايين الصور عالية الدقة والجودة.

افتتحت Unsplash واجهة برمجة التطبيقات الخاصة بالصور في عام 2016، وقد وصلت إلى ملايين المكالمات شهريًا ومجموعة متنوعة من سيناريوهات الاستخدام المختلفة. في أغسطس 2020، أعلن موقع Unsplash عن افتتاح مجموعتين من بيانات استرجاع الصور لتوفير مواد بحثية لمزيد من العلماء ومؤسسات البحث.
تحتوي مجموعة بيانات Unsplash على نسختين:
النسخة الخفيفة من مجموعة البيانات (رابط التنزيل هو هذه النسخة):يمكن استخدامها في السيناريوهات التجارية وغير التجارية. يحتوي على معلومات بحث عن 25000 صورة Unsplash ذات طابع طبيعي، بإجمالي 25000 كلمة رئيسية.
النسخة الكاملة لمجموعة البيانات:للإستخدام غير التجاري فقط. يحتوي على معلومات البحث عن 2 مليون صورة عالية الجودة من Unsplash، بإجمالي 5 ملايين كلمة رئيسية.
تُعد مجموعة البيانات هذه نسخة مبسطة من مجموعة البيانات، مع حزمة مضغوطة بحجم 190 ميجا بايت وحزمة غير مضغوطة بحجم 550 ميجا بايت. يحتوي على أربعة ملفات TSV منفصلة (ملاحظة: يمكن تحميل ملفات TSV في قاعدة بيانات PostgreSQL أو بيئة Python):
- المجموعات: 82 ميجابايت
- يحتوي على معلومات حول مجموعات الصور التي أنشأها مستخدمو Unsplash: بما في ذلك البيانات مثل معرف الصورة (photo_id)، ومعرف المجموعة (collection_id)، وعنوان المجموعة (collection_title)، والطابع الزمني (photo_collected_at)؛
- التحويلات : 349 ميجابايت
- يحتوي على معلومات حول الصورة التي حددها المستخدم بعد البحث: بما في ذلك بيانات الطابع الزمني للصورة (convert_at)، والكلمة الأساسية (keyword)، ومعرف الصورة (photo_id)، ومعرف المستخدم المجهول (onymous_user_id)، وموقع المستخدم (conversion_country)؛
- الكلمات المفتاحية: 104 ميجابايت
- تحتوي على بيانات مثل معرف الصورة (photo_id) الذي يبحث عنه المستخدم، والكلمة الرئيسية التي يبحث عنها (keyword)، وقيمة الثقة بين الكلمة الرئيسية والصورة (ai_service_1_confidence)؛
- الصور : 6.5 ميجابايت
- يحتوي على معرف الصورة (photo_id)، وعنوان URL (photo_image_url)، ومعلومات المصور (Photographer_username)، ومعلومات الكاميرا (exif_camera)، والمعلمات (exif_iso)، وإجمالي عدد مشاهدات المنصة (stats_views)، وإجمالي عدد التنزيلات (stats_downloads)، والإحداثيات الجغرافية لموقع التصوير (ai_primary_landmark_name)