HyperAIHyperAI
منذ 18 أيام

التكيف المستند إلى التشتت لتصنيف الصور المعطوبة غير المعروفة

{Kazuki Endo, Masatoshi Okutomi, Masayuki Tanaka, Dinesh Daultani}
التكيف المستند إلى التشتت لتصنيف الصور المعطوبة غير المعروفة
الملخص

تصنيف الصور المعطوبة غير المعروفة يُعد ضروريًا في التطبيقات العملية، نظرًا لأن نماذج تشوه الصور تكون عادةً غير معروفة. توفر النماذج القائمة على الانتشار أداءً محسّنًا في تحسين الصور وإعادة بناء الصور من صور معطوبة. في هذه الدراسة، نستخدم النموذج القائم على الانتشار لغرض التكيّف بدلًا من إعادة البناء. يهدف إعادة البناء من الصورة المعطوبة إلى استعادة صورة نظيفة خالية من التشوهات، بينما يهدف التكيّف من الصورة المعطوبة إلى تحويل الصورة المعطوبة نحو مجال الصور النظيفة. ومع ذلك، تواجه النماذج القائمة على الانتشار صعوبات في أداء التكيّف الصوتي في حالات التشوهات المحددة الناتجة عن نماذج تشوه غير معروفة. ولحل مشكلة الصور النظيفة غير المثالية الناتجة عن النماذج القائمة على الانتشار عند تصنيف الصور المعطوبة، نقترح طريقة جديدة تُسمى "تكيّف الانتشار للصور المعطوبة غير المعروفة" (DiffAUD)، تعتمد على تصنيفات قوية تم تدريبها على عدد قليل من أنواع التشوهات المعروفة. تكمل الطريقة المقترحة النماذج القائمة على الانتشار، وتمتاز بقدرة عامة متسقة على أنواع مختلفة من التشوهات بدرجات شدة متفاوتة. تُحسّن طريقة DiffAUD الأداء مقارنة بنموذج الانتشار الأساسي والتصنيف النظيف على مجموعة بيانات ImageNet-C بنسبة 5.5% و5% و5% باستخدام هياكل ResNet-50 وSwin Transformer (Tiny) وConvNeXt-Tiny على التوالي. علاوةً على ذلك، نُظهر أن تدريب النماذج التصنيفية باستخدام أنواع تشوهات معروفة يُحقق مكاسب كبيرة في الأداء عند تصنيف الصور المعطوبة.