Command Palette
Search for a command to run...
كشف حدود الإطارات بسرعة مفرطة باستخدام الشبكات العصبية التلافيفية الكاملة
كشف حدود الإطارات بسرعة مفرطة باستخدام الشبكات العصبية التلافيفية الكاملة
Gygli Michael
الملخص
كشف حدود المشهد (SBD) يُعد عنصراً أساسياً في العديد من مهام تحليل الفيديو، مثل التعرف على الحركات، وفهرسة الفيديو، وتلخيصه وتحريره. في الدراسات السابقة، كان يتم عادةً استخدام مجموعة من الخصائص من الدرجة الدنيا، مثل مخططات التوزيع اللوني، بالتزامن مع نماذج بسيطة مثل آلات الدعم التمييزية (SVMs). بدلًا من ذلك، نقترح تعلُّم كشف حدود المشهد بطريقة نهائية (end-to-end)، من البكسلات إلى الحدود النهائية للمشاهد. ولتدريب مثل هذا النموذج، نعتمد على رؤيتنا التي تنص على أن جميع حدود المشاهد تُنشأ بشكل تلقائي. وبناءً على ذلك، قمنا بإنشاء مجموعة بيانات تضم مليون إطار، مع انتقالات مُولَّدة تلقائياً، مثل القطع (cuts)، والاندماجات (dissolves)، والانطفاءات (fades). ولتمكين تحليل ساعات من مقاطع الفيديو بكفاءة، نقترح شبكة عصبية تلافيفية (CNN) تكون تلافيفية بالكامل في الزمن، مما يسمح باستخدام سياق زمني واسع دون الحاجة إلى معالجة الإطارات بشكل متكرر. وباستخدام هذه البنية المعمارية، نحصل على نتائج تفوق التقنيات الحالية، مع سرعة تشغيل تتجاوز 120 مرة سرعة التشغيل الفعلي (real-time).