HyperAIHyperAI
منذ 2 أشهر

المرجعية المستندة إلى الفيديو فائقة الدقة باستخدام ثلاثيات الفيديو متعددة الكاميرات

Junyong Lee; Myeonghee Lee; Sunghyun Cho; Seungyong Lee
المرجعية المستندة إلى الفيديو فائقة الدقة باستخدام ثلاثيات الفيديو متعددة الكاميرات
الملخص

نقترح أول نهج لزيادة دقة الفيديو بالرجوع إلى مرجع (RefVSR) يستخدم مقاطع فيديو مرجعية لتحقيق نتائج عالية الدقة. نركز على RefVSR في إعداد ثلاثي الكاميرات، حيث نهدف إلى زيادة دقة الفيديو ذي الزاوية فائقة الاتساع باستخدام مقاطع الفيديو ذات الزاوية العريضة والفيديو التيليفوتوغرافي. نقدم أول شبكة RefVSR تتم فيها المطابقة والتوزيع المتكرر للخصائص المرجعية الزمنية التي تم دمجها مع الخصائص المستخرجة من الإطارات ذات الدقة المنخفضة. لتسهيل دمج وتوزيع الخصائص المرجعية الزمنية، نقترح وحدة دمج زمني توزيعي. لأغراض التعلم وتقييم شبكتنا، نقدم أول مجموعة بيانات RefVSR تتكون من ثلاثيات مقاطع الفيديو فائقة الاتساع والزاوية العريضة والفيديوهات التيليفوتوغرافية التي تم التقاطها بشكل متزامن من ثلاث كاميرات في هاتف ذكي. كما نقترح استراتيجية تدريب ثنائية المرحلة تستفيد بشكل كامل من الثلاثيات الفيديوية في المجموعة البيانات المقترحة لتحقيق زيادة الدقة بواقع 4 أضعاف في العالم الحقيقي. قمنا بتقييم طرقنا بشكل شامل، وأظهرت النتائج أداءً يتفوق على أفضل ما هو موجود حالياً في زيادة الدقة بواقع 4 أضعاف.

المرجعية المستندة إلى الفيديو فائقة الدقة باستخدام ثلاثيات الفيديو متعددة الكاميرات | أحدث الأوراق البحثية | HyperAI