HyperAIHyperAI
منذ شهر واحد

المحاذاة الزمنية الانتقائية للتكيف بين مجالات الفيديو على نطاق واسع

Min-Hung Chen; Zsolt Kira; Ghassan AlRegib; Jaekwon Yoo; Ruxin Chen; Jian Zheng
المحاذاة الزمنية الانتقائية للتكيف بين مجالات الفيديو على نطاق واسع
الملخص

رغم اقتراح العديد من تقنيات التكيف بين المجالات (DA) القائمة على الصور في السنوات الأخيرة، فإن التحول بين المجالات في الفيديوهات لا يزال غير مستكشف بشكل جيد. ومعظم الأعمال السابقة تقيّم الأداء فقط على مجموعات بيانات صغيرة الحجم والتي تكون مششبعة. لذلك، نقترح أولاً مجموعتين كبيرتين لمجموعات بيانات التكيف بين المجالات في الفيديو ذات الاختلاف الكبير بين المجالات: UCF-HMDB_full و Kinetics-Gameplay. ثانيًا، ندرس طرق مختلفة لدمج التكيف بين المجالات في الفيديوهات، ونظهر أن مواءمة الديناميكيات الزمنية والتعلم منها في الوقت نفسه يحقق مواءمة فعالة حتى بدون استخدام طرق معقدة للتكيف بين المجالات. وأخيرًا، نقترح شبكة التكيف المعادية الانتباهية الزمنية (TA3N)، التي تركز بوضوح على الديناميكيات الزمنية باستخدام الاختلاف بين المجالات لتحقيق مواءمة أكثر فعالية، مما يحقق أفضل الأداء على أربع مجموعات بيانات للتكيف بين المجالات في الفيديو (مثل زيادة الدقة بنسبة 7.9% فوق "المصدر فقط" من 73.9% إلى 81.8% على "HMDB --> UCF"، وزيادة بنسبة 10.3% على "Kinetics --> Gameplay"). تم إصدار الكود والبيانات في http://github.com/cmhungsteve/TA3N.