HyperAIHyperAI

Command Palette

Search for a command to run...

كشف حدود الإطارات بسرعة مفرطة باستخدام الشبكات العصبية التلافيفية الكاملة

Gygli Michael

الملخص

كشف حدود المشهد (SBD) يُعد عنصراً أساسياً في العديد من مهام تحليل الفيديو، مثل التعرف على الحركات، وفهرسة الفيديو، وتلخيصه وتحريره. في الدراسات السابقة، كان يتم عادةً استخدام مجموعة من الخصائص من الدرجة الدنيا، مثل مخططات التوزيع اللوني، بالتزامن مع نماذج بسيطة مثل آلات الدعم التمييزية (SVMs). بدلًا من ذلك، نقترح تعلُّم كشف حدود المشهد بطريقة نهائية (end-to-end)، من البكسلات إلى الحدود النهائية للمشاهد. ولتدريب مثل هذا النموذج، نعتمد على رؤيتنا التي تنص على أن جميع حدود المشاهد تُنشأ بشكل تلقائي. وبناءً على ذلك، قمنا بإنشاء مجموعة بيانات تضم مليون إطار، مع انتقالات مُولَّدة تلقائياً، مثل القطع (cuts)، والاندماجات (dissolves)، والانطفاءات (fades). ولتمكين تحليل ساعات من مقاطع الفيديو بكفاءة، نقترح شبكة عصبية تلافيفية (CNN) تكون تلافيفية بالكامل في الزمن، مما يسمح باستخدام سياق زمني واسع دون الحاجة إلى معالجة الإطارات بشكل متكرر. وباستخدام هذه البنية المعمارية، نحصل على نتائج تفوق التقنيات الحالية، مع سرعة تشغيل تتجاوز 120 مرة سرعة التشغيل الفعلي (real-time).


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp
كشف حدود الإطارات بسرعة مفرطة باستخدام الشبكات العصبية التلافيفية الكاملة | مستندات | HyperAI