HyperAIHyperAI

Command Palette

Search for a command to run...

النقل المثالي غير المتوازن مع التجانس الزمني لتقسيم الأفعال بدون إشراف

Ming Xu; Stephen Gould

الملخص

نقترح نهجًا جديدًا لمهمة تقسيم الأفعال في مقاطع الفيديو الطويلة غير المقصوصة، يعتمد على حل مشكلة النقل الأمثل. من خلال ترميز أولوية التوافق الزمني في مشكلة غروmov-واسرشتاين (Gromov-Wasserstein)، نتمكن من فك رموز تقسيم متوافق زمنيًا من مصفوفة تكلفة الارتباط/المطابقة الضوضائية بين إطارات الفيديو وفئات الأفعال. بخلاف النهج السابقة، لا يتطلب أسلوبنا معرفة ترتيب الأفعال في الفيديو للحصول على توافق زمني. بالإضافة إلى ذلك، يمكن حل مشكلة غروmov-واسرشتاين الناتجة (المدمجة) بكفاءة على وحدات معالجة الرسومات (GPUs) باستخدام عدد قليل من عمليات الهبوط المرآتي المُسَتَوْحَد. نوضح فعالية طريقتنا في إطار التعلم بدون إشراف، حيث يتم استخدامها لتوليد علامات زائفة لتدريب الذات. نقيم نهج التقسيم الخاص بنا وأنبوب التعلم بدون إشراف على مجموعات بيانات Breakfast و50-Salads وYouTube Instructions وDesktop Assembly، مما يؤدي إلى تحقيق أفضل النتائج الحالية لمهمة تقسيم أفعال الفيديو بدون إشراف.


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp
النقل المثالي غير المتوازن مع التجانس الزمني لتقسيم الأفعال بدون إشراف | مستندات | HyperAI