HyperAIHyperAI

Command Palette

Search for a command to run...

تقييم عميقة لجماليات الصورة الفوتوغرافية مع الحفاظ على التركيب

Long Mai Hailin Jin Feng Liu

الملخص

تقييم جمالية الصور يُعد تحديًا كبيرًا. وقد أظهرت الأساليب القائمة على الشبكات العصبية التلافيفية العميقة (ConvNet) نتائج واعدة مؤخرًا في مجال تقييم جمالية الصور. ومع ذلك، فإن أداء هذه الأساليب العميقة غالبًا ما يتأثر بالقيود الناتجة عن حقيقة أن الشبكة العصبية تتلقى فقط مدخلات بحجم ثابت. وللتوافق مع هذا الشرط، يُجبَر على تطبيق عمليات تحويل على الصور الأصلية مثل القص أو التحجيم أو الحشو، وهي عمليات تُسبب غالبًا تلفًا في تراكيب الصور، أو تقليل دقة الصورة، أو تشويه الصورة، مما يؤدي إلى تدهور جمالية الصورة الأصلية. في هذه الورقة، نقدّم أسلوبًا جديدًا يعتمد على الشبكة العصبية التلافيفية العميقة ويحافظ على التراكيب، ويتعلّم خصائص الجمالية مباشرة من الصور الأصلية دون أي تحويلات مسبقة. وبشكل محدد، نضيف طبقة تجميع مكاني متكيفة فوق الطبقات العادية للتحفيز والاختزال، لتمكين المعالجة المباشرة للصور بمقاييسها ونسب أطوالها الأصلية. ولتمكين استخلاص الميزات على مقاييس متعددة، نطوّر بنية معمارية تُسمى Multi-Net Adaptive Spatial Pooling ConvNet، والتي تتكون من عدة شبكات فرعية ذات أحجام مختلفة لطبقة التجميع المكاني المتكيفة، ونستخدم طبقة تجميع مبنية على السياق لدمج التنبؤات الناتجة من الشبكات الفرعية المتعددة بشكل فعّال. وقد أظهرت تجاربنا على معيار تقييم جمالية الصور الكبير (AVA) أن أسلوبنا يمكنه تحسين نتائج الحالة الحالية بشكل ملحوظ في مجال تقييم جمالية الصور.


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp