HyperAIHyperAI
منذ 17 أيام

دالة التكلفة المُستَدرَجة في التدفق البصري غير الخاضع للإشراف

Gal Lifshitz, Dan Raviv
دالة التكلفة المُستَدرَجة في التدفق البصري غير الخاضع للإشراف
الملخص

تُستخدم خوارزميات الانحدار الأقصى بشكل شائع في التعلم العميق، حيث تُعتمد المُشتقة (الGradient) كاتجاه للانخفاض، إما بشكل مباشر أو بعد تطبيق تحويل في الاتجاه باستخدام عملية التمهيد (Preconditioning). في العديد من السيناريوهات، يُعد حساب المُشتقة صعبًا رقميًا بسبب تعقيد دوال التكلفة أو عدم قابليتها للاشتقاق، خاصة بالقرب من النقاط المفردة. في هذا العمل، نركّز على استخلاص القياس شبه-القيمة المطلقة (Total Variation semi-norm) الذي يُستخدم بشكل شائع في دوال التكلفة غير المراقبة. وبشكل خاص، نُحدّد مُعادلًا قابلاً للاشتقاق للقيود القاسية على السلسة (L1 smoothness constraint) ضمن مخطط تكراري جديد نُسميه "تفكيك التكلفة" (Cost Unrolling). وبفضل إنتاج مشتقات أكثر دقة أثناء التدريب، يُمكّننا هذا الأسلوب من تحسين تنبؤات نموذج الشبكة العصبية العميقة (DNN) من خلال تحسين التقارب، دون الحاجة إلى تعديل البنية المعمارية أو زيادة التعقيد الحسابي. نُظهر فعالية هذا الأسلوب في مهمة تدفق الضوء غير المراقبة. وباستبدال قيد السلسة L1 بدلالة التكلفة المُفككة خلال تدريب نموذج أساسي معروف، نُبلغ عن تحسينات ملحوظة على كلا معياري تدفق الضوء غير المراقبة: MPI Sintel وKITTI 2015. وبشكل خاص، نُسجّل تقليلًا بنسبة تصل إلى 15.82% في الخطأ المتوسط المطلق (EPE) بالنسبة للنقاط المُغطاة، حيث تكون قيود السلسة هي العامل المهيمن، مما يُمكّن من كشف حواف الحركة أكثر وضوحًا ودقة.

دالة التكلفة المُستَدرَجة في التدفق البصري غير الخاضع للإشراف | أحدث الأوراق البحثية | HyperAI