HyperAIHyperAI
منذ 2 أشهر

TransNet V2: هندسة شبكة عميقة فعالة للكشف السريع عن انتقالات اللقطات

Souček, Tomáš ; Lokoč, Jakub
TransNet V2: هندسة شبكة عميقة فعالة للكشف السريع عن انتقالات اللقطات
الملخص

رغم أن طرق الكشف التلقائي عن انتقالات المشاهد قد تم دراستها لأكثر من عقدين، إلا أنه لم يتم اقتراح نموذج فعّال على مستوى الإنسان بشكل شامل بعد. حتى بالنسبة لانتقالات المشاهد الشائعة مثل القطع الحاد أو التغييرات التدريجية البسيطة، فإن التنوع المحتمل في محتويات الفيديو المُحلَّلة قد يؤدي لا يزال إلى حالات تحقق خاطئ وحالات رفض خاطئ. مؤخرًا، ساهمت الطرق القائمة على التعلم العميق بشكل كبير في تحسين دقة الكشف عن انتقالات المشاهد باستخدام هياكل متعددة الأبعاد (3D convolutional architectures) والبيانات التدريبية المصطنعة. ومع ذلك، لا يزال الدقة الكاملة مثالية غير قابلة للتحقيق. في هذا البحث، نشارك الإصدار الحالي من شبكتنا العميقة TransNet V2 التي تحقق أداءً رائدًا على مقاييس محترمة. يتم توفير نسخة مدربة من النموذج بحيث يمكن استخدامها فورًا من قبل المجتمع لتحليل كميات كبيرة من أرشيف الفيديو بكفاءة عالية. بالإضافة إلى ذلك، يتم تفصيل هندسة الشبكة وتجربتنا مع عملية التدريب، بما في ذلك شفرات برمجية بسيطة تسهل استخدام النموذج المقترح وتوضيح النتائج.

TransNet V2: هندسة شبكة عميقة فعالة للكشف السريع عن انتقالات اللقطات | أحدث الأوراق البحثية | HyperAI