HyperAIHyperAI

Command Palette

Search for a command to run...

DPFlow: تقدير التدفق البصري التكيفي باستخدام إطار هرمي مزدوج

Henrique Morimitsu Xiaobin Zhu Roberto M. Cesar Jr. Xiangyang Ji Xu-Cheng Yin

الملخص

يُعد تقدير التدفق البصري ضروريًا لمهام معالجة الفيديو، مثل الاستعادة وتمييز الحركات. وتستمر جودة الفيديو في التحسن، حيث تصل المعايير الحالية إلى دقة 8K. ومع ذلك، فإن طرق التدفق البصري عادةً ما تُصمم للدقة المنخفضة ولا تتميّز بالقدرة على التعميم على المدخلات الكبيرة بسبب هيكلها الثابت. وتعتمد هذه الطرق على تقنيات تقليل الحجم أو تقسيم المدخلات (input tiling) لتقليل حجم المدخلات، مما يؤدي إلى فقدان التفاصيل والمعلومات الشاملة. كما توجد أيضًا نقص في مجموعات التقييم (benchmarks) الخاصة بالتدفق البصري التي تُستخدم لتقييم الأداء الفعلي للطرق الحالية على العينات ذات الدقة العالية. فقد قام العمل السابق بتقييمات كمية على عينات عالية الدقة تم اختيارها يدويًا فقط. تملأ هذه الورقة الفجوة في تقدير التدفق البصري بطريقتين. نحن نُقدّم DPFlow، وهي بنية تدفق بصري مُتكيفة قادرة على التعميم حتى على مدخلات بدقة 8K، مع تدريبها فقط على عينات ذات دقة منخفضة. كما نُقدّم Kubric-NK، وهي مجموعة تقييم جديدة لتقييم طرق التدفق البصري على مدخلات ذات دقة تتراوح بين 1K و8K. ويساهم تقييمنا عالي الدقة في توسيع حدود الطرق الحالية، ويُكشف عن رؤى جديدة حول قدرتها على التعميم. وتشير النتائج التجريبية الواسعة إلى أن DPFlow تحقق نتائج متفوقة على مستوى الحالة الحالية (state-of-the-art) في مجموعات MPI-Sintel، KITTI 2015، Spring، وغيرها من مجموعات التقييم ذات الدقة العالية.


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp