مجموعة بيانات الأفلام مجموعة بيانات معلومات الأفلام
التاريخ
الحجم
رابط النشر
الترخيص
CC BY 4.0
العلامات
تحتوي مجموعة البيانات هذه على بيانات وصفية مفصلة لـ 45000 فيلم في مجموعة بيانات MovieLens الكاملة، والتي تم إصدارها جميعًا قبل يوليو 2017. لا تغطي مجموعة البيانات هذه المعلومات الأساسية حول الأفلام فحسب، مثل الملصقات والخلفيات والميزانيات والإيرادات، بل تتضمن أيضًا معلومات مفصلة مثل تاريخ الإصدار واللغة وبلد الإنتاج والشركة. بالإضافة إلى ذلك، فهو يحتوي على 26 مليون تقييم من 270 ألف مستخدم، والتي يتم تصنيفها من 1 إلى 5 نقاط، مما يوفر بيانات قيمة لدراسة شعبية الأفلام.
كانت مجموعة البيانات هذه مستوحاة من مشروع التخرج للمؤلف في مسار Springboard Data Science Career Track، والذي يهدف إلى بناء أنواع مختلفة من أنظمة التوصية من خلال تحليل البيانات الاستكشافية لبيانات الأفلام. يتم توفير دفاتر المؤلفين، بما في ذلك "قصة الأفلام" و"أنظمة التوصية بالأفلام"، كنوى مع مجموعة البيانات، مما يوفر أدوات عملية للباحثين والمطورين المهتمين باكتساب رؤى حول بيانات الأفلام.
محتوى البيانات:
- بيانات تعريف الأفلام.csv:ملف بيانات الفيلم الرئيسي. يحتوي على معلومات حول 45000 فيلمًا في مجموعة بيانات MovieLens الكاملة. تتضمن المعلومات الملصق، والخلفية، والميزانية، والإيرادات، وتاريخ الإصدار، واللغة، وبلد الإنتاج، والشركة.
- الكلمات المفتاحية.csv:يحتوي على كلمات رئيسية لمؤامرة الفيلم لأفلام MovieLens. يتم توفيره ككائن JSON متسلسل.
- الاعتمادات.csv:يحتوي على معلومات عن طاقم العمل والممثلين لجميع الأفلام. يتم توفيره ككائن JSON متسلسل.
- links.csv:ملف يحتوي على معرفات TMDB وIMDB لجميع الأفلام في مجموعة بيانات Full MovieLens.
- links_small.csv:يحتوي على معرفات TMDB وIMDB لمجموعة فرعية صغيرة مكونة من 9000 فيلم من مجموعة البيانات الكاملة.
- ratings_small.csv: مجموعة فرعية من 100000 تقييم من 700 مستخدم لـ 9000 فيلم.
وباستخدام هذه المجموعة من البيانات، يستطيع الباحثون إجراء مجموعة متنوعة من التحليلات، مثل التنبؤ بإيرادات الأفلام واحتمالات النجاح، أو بناء محركات توصية تعتمد على المحتوى وأنظمة توصية بالترشيح التعاوني. ولا تساعد هذه التحليلات في فهم ديناميكيات صناعة الأفلام فحسب، بل توفر أيضًا أساسًا علميًا لتصميم أنظمة توصية الأفلام.