شبكة متعددة المقياس الفعالة مع تحويل موجي منفصل قابل للتعلم لتطهير الحركة العمياء

تُستخدم السchemes من الخشنة إلى الدقيقة على نطاق واسع في تفتيت التمويه الحركي لصورة واحدة تقليدية؛ ومع ذلك، في سياق التعلم العميق، تتطلب الخوارزميات متعددة المقياس الحالية استخدام وحدات معقدة لدمج الميزات الصغيرة للصور RGB والمعاني العميقة، بالإضافة إلى إنشاء أزواج صور منخفضة الدقة يدويًا لا تتمتع بثقة كافية. في هذا العمل، نقترح شبكة متعددة المقياس تعتمد على مدخل واحد وعديد من المخرجات (SIMO) لتفسير التمويه الحركي. ويقلل هذا من تعقيد الخوارزميات القائمة على نموذج الخشنة إلى الدقيقة. ولتخفيف عيوب الاستعادة التي تؤثر على المعلومات التفصيلية الناتجة عن استخدام بنية متعددة المقياس، ندمج خصائص مسارات التمويه الواقعية مع وحدة تحويل موجة قابلة للتعلم، بهدف التركيز على الاستمرارية الاتجاهية وخصائص التردد في التحولات التدريجية بين الصور المشوهة والصور الواضحة. في الختام، نقترح شبكة متعددة المقياس تعتمد على تحويل موجة منفصل قابل للتعلم (MLWNet)، والتي تُظهر أداءً من الدرجة الأولى على عدة مجموعات بيانات تفتيت التمويه الحركي الواقعية، من حيث الجودة الذاتية والكمية، بالإضافة إلى الكفاءة الحسابية.