شبكة ترتيب جماليات الصور مع السمات والتكيف مع المحتوى

يمكن أن تستفيد التطبيقات الحقيقية من القدرة على توليد تصنيف دقيق تلقائي لجمال الصور. ومع ذلك، ركزت الأساليب السابقة في تحليل جمال الصور بشكل أساسي على تصنيف خشن ثنائي للصور إلى فئات ذات جودة عالية أو منخفضة. في هذا البحث، نقترح تعلم شبكة عصبية تقنية التعلم العميق بالتجانس (الشبكة العصبية المتشابكة المتعمقة) لتقييم جمال الصور، حيث يتم نمذجة الترتيب النسبي لجمال الصور مباشرة في دالة الخسارة. يدمج نموذجنا التعلم المشترك للسمات الفوتوغرافية الهامة ومعلومات محتوى الصورة، مما يمكن أن يساعد في تنظيم مشكلة تقييم جمال الصور المعقدة.لتدريب وتحليل هذا النموذج، قمنا بتجميع قاعدة بيانات جديدة لجمال الصور والسمات (AADB) تحتوي على درجات الجمال والسمات الهامة التي تم تعيينها لكل صورة بواسطة عدة مقيمين بشر. يتم تسجيل هويات المقيمين بشكل مجهول عبر الصور، مما يتيح لنا استغلال الثبات داخل المقيم باستخدام استراتيجية عينة جديدة عند حساب خسارة الترتيب لأزواج الصور التدريبية. نظهر أن الاستراتيجية المقترحة للتوزيع العيني فعّالة للغاية ومستقرة أمام الحكم الذاتي لجمال الصور من قبل أفراد ذوي أذواق جمالية مختلفة. تثبت التجارب أن نموذجنا الموحد يمكنه إنتاج تصنيفات للجمال أكثر اتساقًا مع التقييم البشري. للتحقق أكثر من نموذجنا، نوضح أنه عن طريق وضع حدود بسيطة للدرجات المقدرة للجمال، يمكننا تحقيق أفضل الأداء في تصنيف على مقاييس مجموعة البيانات AVA القائمة.