Command Palette
Search for a command to run...
المصارف الميزات طويلة الأجل لفهم الفيديو بالتفصيل
المصارف الميزات طويلة الأجل لفهم الفيديو بالتفصيل
Wu Chao-Yuan ; Feichtenhofer Christoph ; Fan Haoqi ; He Kaiming ; Krähenbühl Philipp ; Girshick Ross
الملخص
لفهم العالم، يحتاج البشر باستمرار إلى ربط الحاضر بالماضي ووضع الأحداث في سياقها. في هذا البحث، نمكّن النماذج الفيديوية الحالية من القيام بنفس الشيء. نقترح بنكًا للخصائص طويلة المدى---المعلومات الداعمة المستخرجة على مدى كامل مدة الفيديو---لتعزيز النماذج الفيديوية الرائدة التي تقتصر عادةً على مشاهدة مقاطع قصيرة مدتها 2-5 ثوانٍ. تظهر تجاربنا أن تعزيز شبكات التحويل الثلاثية الأبعاد ببنك الخصائص طويل المدى يحقق نتائج رائدة على ثلاثة مجموعات بيانات فيديو صعبة: AVA، EPIC-Kitchens، وCharades.