Command Palette
Search for a command to run...
A-Lamp: شبكة عصبية عميقة متعددة القطع ذات تخطيط تكيفي واعٍ للهيكل لتقدير جمالية الصور الفوتوغرافية
A-Lamp: شبكة عصبية عميقة متعددة القطع ذات تخطيط تكيفي واعٍ للهيكل لتقدير جمالية الصور الفوتوغرافية
Ma Shuang Liu Jing Chen Chang Wen
الملخص
أظهرت الشبكات العصبية التلافيفية العميقة (CNN) مؤخرًا نتائج واعدة في تقييم الجمالية البصرية للصور. ومع ذلك، فإن أداء هذه الأساليب القائمة على الشبكات العصبية العميقة غالبًا ما يتأثر بقيود تقتضي أن تكون إدخالات الشبكة بحجم ثابت. ولتلبية هذا الشرط، يتعين تحويل الصور المدخلة من خلال عمليات التقليم أو التشويه أو التعبئة، والتي غالبًا ما تؤدي إلى تغيير تركيب الصورة، أو تقليل دقة الصورة، أو إحداث تشوهات فيها. وبالتالي، يتأثر تقييم الجمالية الأصلية للصورة بسبب فقدان التفاصيل الدقيقة أو التخطيط العام للصورة. وتجدر الإشارة إلى أن التفاصيل الدقيقة والهيكل العام للصورة يُعدان عنصرين حاسمين في تقييم جمالية الصورة. في هذا البحث، نقدم بنية جديدة تُسمى "الشبكة العصبية التلافيفية متعددة القطع المُستجيبة للهيكل (A-Lamp CNN)" لتقدير جمالية الصور الفوتوغرافية. تتميز هذه البنية المبتكرة بقدرتها على استقبال صور بأحجام متعددة ومتغيرة، وتمكّن من التعلم من التفاصيل الدقيقة والهيكل العام للصورة في آنٍ واحد. ولتمكين التدريب على مدخلات مختلطة من هذا النوع، قمنا بتوسيع الأسلوب من خلال تطوير هيكل شبكي عصبي مزدوج مخصص، يتألف من "وحدة متعددة القطع" و"وحدة مُستجيبة للهيكل". كما قمنا ببناء طبقة تجميع فعّالة لدمج الميزات المختلطة الناتجة من هاتين الوحدتين. وقد أظهرت التجارب الواسعة على معيار التقييم الكبير للجمالية (AVA) تحسنًا ملحوظًا في الأداء مقارنةً بأفضل الأساليب الحالية في تقييم جمالية الصور.