HyperAIHyperAI

Command Palette

Search for a command to run...

A-Lamp: شبكة عصبية عميقة متعددة القطع ذات تخطيط تكيفي واعٍ للهيكل لتقدير جمالية الصور الفوتوغرافية

Ma Shuang Liu Jing Chen Chang Wen

الملخص

أظهرت الشبكات العصبية التلافيفية العميقة (CNN) مؤخرًا نتائج واعدة في تقييم الجمالية البصرية للصور. ومع ذلك، فإن أداء هذه الأساليب القائمة على الشبكات العصبية العميقة غالبًا ما يتأثر بقيود تقتضي أن تكون إدخالات الشبكة بحجم ثابت. ولتلبية هذا الشرط، يتعين تحويل الصور المدخلة من خلال عمليات التقليم أو التشويه أو التعبئة، والتي غالبًا ما تؤدي إلى تغيير تركيب الصورة، أو تقليل دقة الصورة، أو إحداث تشوهات فيها. وبالتالي، يتأثر تقييم الجمالية الأصلية للصورة بسبب فقدان التفاصيل الدقيقة أو التخطيط العام للصورة. وتجدر الإشارة إلى أن التفاصيل الدقيقة والهيكل العام للصورة يُعدان عنصرين حاسمين في تقييم جمالية الصورة. في هذا البحث، نقدم بنية جديدة تُسمى "الشبكة العصبية التلافيفية متعددة القطع المُستجيبة للهيكل (A-Lamp CNN)" لتقدير جمالية الصور الفوتوغرافية. تتميز هذه البنية المبتكرة بقدرتها على استقبال صور بأحجام متعددة ومتغيرة، وتمكّن من التعلم من التفاصيل الدقيقة والهيكل العام للصورة في آنٍ واحد. ولتمكين التدريب على مدخلات مختلطة من هذا النوع، قمنا بتوسيع الأسلوب من خلال تطوير هيكل شبكي عصبي مزدوج مخصص، يتألف من "وحدة متعددة القطع" و"وحدة مُستجيبة للهيكل". كما قمنا ببناء طبقة تجميع فعّالة لدمج الميزات المختلطة الناتجة من هاتين الوحدتين. وقد أظهرت التجارب الواسعة على معيار التقييم الكبير للجمالية (AVA) تحسنًا ملحوظًا في الأداء مقارنةً بأفضل الأساليب الحالية في تقييم جمالية الصور.


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp