HyperAIHyperAI
منذ 17 أيام

DPFlow: تقدير التدفق البصري التكيفي باستخدام إطار هرمي مزدوج

Henrique Morimitsu, Xiaobin Zhu, Roberto M. Cesar Jr., Xiangyang Ji, Xu-Cheng Yin
DPFlow: تقدير التدفق البصري التكيفي باستخدام إطار هرمي مزدوج
الملخص

يُعد تقدير التدفق البصري ضروريًا لمهام معالجة الفيديو، مثل الاستعادة وتمييز الحركات. وتستمر جودة الفيديو في التحسن، حيث تصل المعايير الحالية إلى دقة 8K. ومع ذلك، فإن طرق التدفق البصري عادةً ما تُصمم للدقة المنخفضة ولا تتميّز بالقدرة على التعميم على المدخلات الكبيرة بسبب هيكلها الثابت. وتعتمد هذه الطرق على تقنيات تقليل الحجم أو تقسيم المدخلات (input tiling) لتقليل حجم المدخلات، مما يؤدي إلى فقدان التفاصيل والمعلومات الشاملة. كما توجد أيضًا نقص في مجموعات التقييم (benchmarks) الخاصة بالتدفق البصري التي تُستخدم لتقييم الأداء الفعلي للطرق الحالية على العينات ذات الدقة العالية. فقد قام العمل السابق بتقييمات كمية على عينات عالية الدقة تم اختيارها يدويًا فقط. تملأ هذه الورقة الفجوة في تقدير التدفق البصري بطريقتين. نحن نُقدّم DPFlow، وهي بنية تدفق بصري مُتكيفة قادرة على التعميم حتى على مدخلات بدقة 8K، مع تدريبها فقط على عينات ذات دقة منخفضة. كما نُقدّم Kubric-NK، وهي مجموعة تقييم جديدة لتقييم طرق التدفق البصري على مدخلات ذات دقة تتراوح بين 1K و8K. ويساهم تقييمنا عالي الدقة في توسيع حدود الطرق الحالية، ويُكشف عن رؤى جديدة حول قدرتها على التعميم. وتشير النتائج التجريبية الواسعة إلى أن DPFlow تحقق نتائج متفوقة على مستوى الحالة الحالية (state-of-the-art) في مجموعات MPI-Sintel، KITTI 2015، Spring، وغيرها من مجموعات التقييم ذات الدقة العالية.

DPFlow: تقدير التدفق البصري التكيفي باستخدام إطار هرمي مزدوج | أحدث الأوراق البحثية | HyperAI