HyperAIHyperAI

Command Palette

Search for a command to run...

TransNet V2: هندسة شبكة عميقة فعالة للكشف السريع عن انتقالات اللقطات

Tomáš Souček Jakub Lokoč

الملخص

رغم أن طرق الكشف التلقائي عن انتقالات المشاهد قد تم دراستها لأكثر من عقدين، إلا أنه لم يتم اقتراح نموذج فعّال على مستوى الإنسان بشكل شامل بعد. حتى بالنسبة لانتقالات المشاهد الشائعة مثل القطع الحاد أو التغييرات التدريجية البسيطة، فإن التنوع المحتمل في محتويات الفيديو المُحلَّلة قد يؤدي لا يزال إلى حالات تحقق خاطئ وحالات رفض خاطئ. مؤخرًا، ساهمت الطرق القائمة على التعلم العميق بشكل كبير في تحسين دقة الكشف عن انتقالات المشاهد باستخدام هياكل متعددة الأبعاد (3D convolutional architectures) والبيانات التدريبية المصطنعة. ومع ذلك، لا يزال الدقة الكاملة مثالية غير قابلة للتحقيق. في هذا البحث، نشارك الإصدار الحالي من شبكتنا العميقة TransNet V2 التي تحقق أداءً رائدًا على مقاييس محترمة. يتم توفير نسخة مدربة من النموذج بحيث يمكن استخدامها فورًا من قبل المجتمع لتحليل كميات كبيرة من أرشيف الفيديو بكفاءة عالية. بالإضافة إلى ذلك، يتم تفصيل هندسة الشبكة وتجربتنا مع عملية التدريب، بما في ذلك شفرات برمجية بسيطة تسهل استخدام النموذج المقترح وتوضيح النتائج.


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp
TransNet V2: هندسة شبكة عميقة فعالة للكشف السريع عن انتقالات اللقطات | مستندات | HyperAI