HyperAIHyperAI

Command Palette

Search for a command to run...

شبكة نقل عميقة للفصل الكائنات في الفيديو غير المُشرَّف

Bo Liu Qingshan Liu Dong Liu Zicheng Zhao Kaihua Zhang

الملخص

تُدمج الطرق الشائعة للفصل الكائنات في الفيديو غير المُراقبة الإطار الملون (RGB) والتدفق البصري من خلال شبكة ذات تدفقين. ومع ذلك، فإن هذه الطرق لا تستطيع التعامل مع الضوضاء المُربكة في كل من وسائط الإدخال، والتي قد تؤدي إلى تدهور كبير في أداء النموذج. نقترح إقامة علاقة تطابق بين وسائط الإدخال مع تقليل تأثير الإشارات المشتتة من خلال التماثل الهيكلي الأمثل. عند معالجة إطار فيديو معين، نستخرج السمات المحلية الكثيفة من الصورة الملونة والتدفق البصري، ونعاملها كتمثيلين معقدين هيكليًا. ثم نستخدم مسافة واسيرشتين لحساب التدفقات المثلى عالميًا لنقل السمات من وسيلة إدخال إلى أخرى، حيث يقاس حجم كل تدفق بدرجة التوافق بين سمتين محليتين. ولدمج التماثل الهيكلي في شبكة ذات تدفقين لتدريب نموذج من البداية إلى النهاية، نقوم بتقسيم مصفوفة التكلفة الإدخالية إلى كتل مكانيّة صغيرة، ونصمم وحدة سينكورن قابلة للتفاضل تتكون من طبقة سينكورن طويلة المدى وطبقة سينكورن قصيرة المدى. ندمج هذه الوحدة في شبكة ذات تدفقين مخصصة، ونسمي نموذجنا "ترانسポート نت" (TransportNet). تُظهر تجاربنا أن محاذاة الحركة والملامح تُحقق نتائج متقدمة على مستوى التقنيات الحالية في مجموعات بيانات الفصل الكائنات في الفيديو الشهيرة.


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp
شبكة نقل عميقة للفصل الكائنات في الفيديو غير المُشرَّف | مستندات | HyperAI