تقييم الجودة الجمالية العميقة باستخدام المعلومات الدلالية

يقوم البشر غالبًا بتقييم جودة الصورة الجمالية مع تحديد محتوى الصورة الدلالي (semantic content). تتناول هذه الورقة المشكلة المتعلقة بالعلاقة بين تقييم الجودة الجمالية التلقائي وتعرف المعنى. نعتبر مشكلة التقييم هي المهمة الرئيسية ضمن نموذج عميق متعدد المهام، ونؤكد أن مهمة التعرف على المعنى تقدم المفتاح لحل هذه المشكلة. استنادًا إلى الشبكات العصبية التلافيفية (convolutional neural networks)، نستخدم إطار عمل متعدد المهام واحد وبسيط لاستخدام الرقابة على العلامات الجمالية والدلالية بكفاءة. يتم إدخال عنصر ارتباط إضافي إلى الإطار من خلال دمج تعلم العلاقة بين المهام. هذا العنصر لا يوفر فقط بعض الرؤى المفيدة حول الارتباط، بل يحسن أيضًا دقة تقييم مهمة الجودة الجمالية. بشكل خاص، تم تطوير استراتيجية فعالة للحفاظ على التوازن بين المهمتين، مما يساعد في تعظيم معلمات الإطار. أثبتت التجارب الواسعة على مجموعة بيانات AVA الصعبة ومجموعة بيانات Photo.net أهمية التعرف على المعنى في تقييم الجودة الجمالية، وأظهرت أن النماذج العميقة المتعددة المهام يمكنها اكتشاف تمثيل جمالي فعال لتحقيق نتائج رائدة في مجالها.