HyperAIHyperAI
منذ 2 أشهر

المصارف الميزات طويلة الأجل لفهم الفيديو بالتفصيل

Wu, Chao-Yuan ; Feichtenhofer, Christoph ; Fan, Haoqi ; He, Kaiming ; Krähenbühl, Philipp ; Girshick, Ross
المصارف الميزات طويلة الأجل لفهم الفيديو بالتفصيل
الملخص

لفهم العالم، يحتاج البشر باستمرار إلى ربط الحاضر بالماضي ووضع الأحداث في سياقها. في هذا البحث، نمكّن النماذج الفيديوية الحالية من القيام بنفس الشيء. نقترح بنكًا للخصائص طويلة المدى---المعلومات الداعمة المستخرجة على مدى كامل مدة الفيديو---لتعزيز النماذج الفيديوية الرائدة التي تقتصر عادةً على مشاهدة مقاطع قصيرة مدتها 2-5 ثوانٍ. تظهر تجاربنا أن تعزيز شبكات التحويل الثلاثية الأبعاد ببنك الخصائص طويل المدى يحقق نتائج رائدة على ثلاثة مجموعات بيانات فيديو صعبة: AVA، EPIC-Kitchens، وCharades.

المصارف الميزات طويلة الأجل لفهم الفيديو بالتفصيل | أحدث الأوراق البحثية | HyperAI