Command Palette
Search for a command to run...
TransNet V2: هندسة شبكة عميقة فعالة للكشف السريع عن انتقالات اللقطات
TransNet V2: هندسة شبكة عميقة فعالة للكشف السريع عن انتقالات اللقطات
Tomáš Souček Jakub Lokoč
الملخص
رغم أن طرق الكشف التلقائي عن انتقالات المشاهد قد تم دراستها لأكثر من عقدين، إلا أنه لم يتم اقتراح نموذج فعّال على مستوى الإنسان بشكل شامل بعد. حتى بالنسبة لانتقالات المشاهد الشائعة مثل القطع الحاد أو التغييرات التدريجية البسيطة، فإن التنوع المحتمل في محتويات الفيديو المُحلَّلة قد يؤدي لا يزال إلى حالات تحقق خاطئ وحالات رفض خاطئ. مؤخرًا، ساهمت الطرق القائمة على التعلم العميق بشكل كبير في تحسين دقة الكشف عن انتقالات المشاهد باستخدام هياكل متعددة الأبعاد (3D convolutional architectures) والبيانات التدريبية المصطنعة. ومع ذلك، لا يزال الدقة الكاملة مثالية غير قابلة للتحقيق. في هذا البحث، نشارك الإصدار الحالي من شبكتنا العميقة TransNet V2 التي تحقق أداءً رائدًا على مقاييس محترمة. يتم توفير نسخة مدربة من النموذج بحيث يمكن استخدامها فورًا من قبل المجتمع لتحليل كميات كبيرة من أرشيف الفيديو بكفاءة عالية. بالإضافة إلى ذلك، يتم تفصيل هندسة الشبكة وتجربتنا مع عملية التدريب، بما في ذلك شفرات برمجية بسيطة تسهل استخدام النموذج المقترح وتوضيح النتائج.