HyperAIHyperAI
منذ 16 أيام

التوحيد الديناميكي للصور ذات المستوى الهرمي

Haoxing Chen, Zhangxuan Gu, Yaohui Li, Jun Lan, Changhua Meng, Weiqiang Wang, Huaxiong Li
التوحيد الديناميكي للصور ذات المستوى الهرمي
الملخص

تُعد مُوَازَنة الصور مهمة حاسمة في رؤية الحاسوب، وتهدف إلى تعديل الصورة الأمامية لجعلها متوافقة مع الخلفية. تركز الدراسات الحديثة بشكل رئيسي على استخدام تحويلات عالمية (مثل التطبيع ورسم منحنيات الألوان) لتحقيق التماسك البصري. ومع ذلك، تتجاهل هذه النماذج التماسك البصري المحلي، كما أن حجمها الكبير يحد من قدرتها على التوافق على الأجهزة الحافة. في هذه الورقة، نقترح شبكة ديناميكية هرمية (HDNet) لتمكين التكيف بين السمات المحلية والعالمية بهدف تحسين التحويل السمات في مُوَازَنة الصور الفعالة. مستوحاة من نجاح النماذج الديناميكية المختلفة، نُقدِّم في هذه الورقة وحدة ديناميكية محلية (LD) ووحدة ديناميكية عالمية واعية بالقناع (MGD). وبشكل محدد، تقوم وحدة LD بتوافق التمثيلات المحلية بين المناطق الأمامية والخلفية بناءً على التشابه الدلالي، ثم تُعدّل بشكل تكيفي كل تمثيل محلي أمامي وفقًا لملامح أقرب خمسة مناطق خلفية (K-أقرب جيران). وبهذه الطريقة، تُنتج وحدة LD صورًا أكثر واقعية على مستوى أدق، مع الحفاظ على خاصية التماثل الدلالي في الوقت نفسه. أما وحدة MGD، فتُطبّق بشكل فعّال تفريعات تفاضلية مختلفة على الصورة الأمامية والخلفية، وتعلم التمثيلات للمناطق الأمامية والخلفية، فضلًا عن ترابطاتها مع التوافق العالمي، مما يُسهم في تحسين التماسك البصري المحلي بشكل أكثر كفاءة. تُظهر النتائج التجريبية أن HDNet تقلل من إجمالي عدد المعلمات في النموذج بنسبة تزيد عن 80% مقارنة بالطرق السابقة، مع الحفاظ على أداء متميز على مجموعة بيانات iHarmony4 الشهيرة. وبشكل لافت، تحقق HDNet تحسنًا بنسبة 4% في معيار PSNR وتقليلًا بنسبة 19% في معيار MSE مقارنة بالطرق السابقة المتميزة.

التوحيد الديناميكي للصور ذات المستوى الهرمي | أحدث الأوراق البحثية | HyperAI