مجموعة بيانات MAMe: حول أهمية خصائص الصور عالية الدقة وشكلها المتغير

في مهمة تصنيف الصور، يُعدّ الأسلوب الشائع هو إعادة تشكيل جميع الصور في مجموعة البيانات إلى شكل موحد، مع تقليل دقتها إلى حجم يُسهّل التجريب على نطاق واسع. ورغم أن هذه الممارسة تتمتع بمزايا من الناحية الحسابية، إلا أنها تترتب عليها آثار سلبية على الأداء نتيجة فقدان المعلومات وتشويه الصور. في هذا العمل، نقدّم مجموعة بيانات تُسمّى MAMe، وهي مجموعة بيانات لتصنيف الصور تتميز بحلّة عالية جدًا وخصائص شكل متغير. يهدف MAMe إلى توفير أداة لدراسة تأثير هذه الخصائص في تصنيف الصور، مع تحفيز الأبحاث في هذا المجال. تضم مجموعة بيانات MAMe الآلاف من الأعمال الفنية من ثلاث متاحف مختلفة، وتقترح مهمة تصنيف تتمثل في التمييز بين 29 وسيلة (أي مواد وتقنيات)، بقيادة خبراء الفن. وبعد استعراض الفريد من نوعه لمجموعة MAMe في سياق مهام تصنيف الصور الحالية، نقدّم وصفًا مفصلاً للمهمة، إلى جانب إحصائيات المجموعة. تم إجراء تجارب لتقييم تأثير استخدام صور عالية الدقة، والمدخلات ذات الأشكال المتغيرة، وكذلك كليهما معًا. تُظهر النتائج التأثير الإيجابي على الأداء عند استخدام صور عالية الدقة، مع تسليط الضوء على غياب الحلول الفعّالة لاستغلال الأشكال المتغيرة. وتكشف تجربة إضافية عن التميّز بين مجموعة بيانات MAMe ونموذج ImageNet التقليدي. وأخيرًا، تم تحليل النماذج الأساسية باستخدام أساليب التفسيرية والمعرفة الخبرائية، للحصول على رؤى حول التحديات التي تظل قائمة في المستقبل.