HyperAIHyperAI
منذ 12 أيام

الاستخلاص المتعدد للقطع القائمة على الانتباه لتقييم الجمالية الصورية

{Wei-Ming Dong, Bao-Gang Hu, Kekai Sheng, Chongyang Ma, Xing Mei, Feiyue Huang}
الملخص

تُعدّ الهياكل التجميعية التي تحتوي على معلومات صريحة، مثل الخصائص البصرية للصور والمعاني السياقية، فعّالة وشائعة في الأنظمة الذكية لتقييم الجمال البصري للبيانات المرئية. ومع ذلك، قد لا تكون المعلومات المفيدة متاحة بسبب التكلفة العالية للتصنيف اليدوي والتصميم المتخصص من قبل الخبراء. في هذه الورقة، نقدّم طريقة جديدة لتجميع القطع المتعددة (MP) لتقييم الجمال البصري للصور. على عكس الطرق الحالية التي تعزز شبكة تجميع القطع المتعددة بخصائص بصرية متنوعة، نُدرّب النموذج بطريقة نهائية (end-to-end) باستخدام علامات الجمال فقط (أي إيجابية أو سلبية من حيث الجمالية). ونحقق هذا الهدف من خلال الاعتماد على آلية انتباه (attention-based mechanism) تُعدّل تلقائيًا أوزان كل قطعة خلال عملية التدريب لتحسين كفاءة التعلّم. بالإضافة إلى ذلك، نقترح مجموعة من الوظائف الهدفية التي تستخدم ثلاث آليات انتباه شائعة (المتوسط، الحد الأدنى، والتكيفية)، ونُقيّم فعاليتها على معيار تحليل الجمال البصري (AVA). تُظهر النتائج العددية أن منهجنا يتفوّق على الطرق الحالية بفارق كبير. ونُثبت فعالية الآليات الهدفية القائمة على الانتباه من خلال دراسات إزالة التأثير (ablation studies)، ونُقدّم رؤى مهمة لتصميم أنظمة تقييم الجمال البصري.

الاستخلاص المتعدد للقطع القائمة على الانتباه لتقييم الجمالية الصورية | أحدث الأوراق البحثية | HyperAI