HyperAIHyperAI
منذ 12 أيام

تقييم عميقة لجماليات الصورة الفوتوغرافية مع الحفاظ على التركيب

{Long Mai, Hailin Jin, Feng Liu}
تقييم عميقة لجماليات الصورة الفوتوغرافية مع الحفاظ على التركيب
الملخص

تقييم جمالية الصور يُعد تحديًا كبيرًا. وقد أظهرت الأساليب القائمة على الشبكات العصبية التلافيفية العميقة (ConvNet) نتائج واعدة مؤخرًا في مجال تقييم جمالية الصور. ومع ذلك، فإن أداء هذه الأساليب العميقة غالبًا ما يتأثر بالقيود الناتجة عن حقيقة أن الشبكة العصبية تتلقى فقط مدخلات بحجم ثابت. وللتوافق مع هذا الشرط، يُجبَر على تطبيق عمليات تحويل على الصور الأصلية مثل القص أو التحجيم أو الحشو، وهي عمليات تُسبب غالبًا تلفًا في تراكيب الصور، أو تقليل دقة الصورة، أو تشويه الصورة، مما يؤدي إلى تدهور جمالية الصورة الأصلية. في هذه الورقة، نقدّم أسلوبًا جديدًا يعتمد على الشبكة العصبية التلافيفية العميقة ويحافظ على التراكيب، ويتعلّم خصائص الجمالية مباشرة من الصور الأصلية دون أي تحويلات مسبقة. وبشكل محدد، نضيف طبقة تجميع مكاني متكيفة فوق الطبقات العادية للتحفيز والاختزال، لتمكين المعالجة المباشرة للصور بمقاييسها ونسب أطوالها الأصلية. ولتمكين استخلاص الميزات على مقاييس متعددة، نطوّر بنية معمارية تُسمى Multi-Net Adaptive Spatial Pooling ConvNet، والتي تتكون من عدة شبكات فرعية ذات أحجام مختلفة لطبقة التجميع المكاني المتكيفة، ونستخدم طبقة تجميع مبنية على السياق لدمج التنبؤات الناتجة من الشبكات الفرعية المتعددة بشكل فعّال. وقد أظهرت تجاربنا على معيار تقييم جمالية الصور الكبير (AVA) أن أسلوبنا يمكنه تحسين نتائج الحالة الحالية بشكل ملحوظ في مجال تقييم جمالية الصور.

تقييم عميقة لجماليات الصورة الفوتوغرافية مع الحفاظ على التركيب | أحدث الأوراق البحثية | HyperAI