HyperAIHyperAI

Command Palette

Search for a command to run...

التجميع الهرمي الموزون زمنياً لتقسيم الأفعال بدون إشراف

M. Saquib Sarfraz extsuperscript1,7 Naila Murray extsuperscript2 Vivek Sharma extsuperscript1,3,4 Ali Diba extsuperscript5 Luc Van Gool extsuperscript5,6 Rainer Stiefelhagen extsuperscript1

الملخص

التفصيل الزمني للأفعال يشير إلى استنتاج حدود المفاهيم البصرية ذات المعنى الموحد في الفيديوهات، وهو متطلب مهم للكثير من مهام فهم الفيديو. بالنسبة لهذه المهام وغيرها من مهام فهم الفيديو، حققت النماذج الإشرافية أداءً مشجعًا ولكنها تتطلب كمية كبيرة من التسميات التفصيلية على مستوى الإطارات. نقدم نهجًا تلقائيًا وكاملًا وغير إشرافي لتفصيل الأفعال في الفيديو لا يتطلب أي تدريب. اقتراحنا هو خوارزمية تجميع هرمي مؤقتة فعالة يمكنها جمع الإطارات ذات المعنى الموحد في الفيديو. أهم ما توصلنا إليه هو أن تمثيل الفيديو برسم بياني للجيران الأقرب (1-NN) مع الأخذ بعين الاعتبار التقدم الزمني كافٍ لتشكيل مجموعات مؤقتة ومتماسكة معنويًا من الإطارات، حيث قد تمثل كل مجموعة بعض الأفعال في الفيديو. بالإضافة إلى ذلك، نحدد خطوط أساس قوية غير إشرافية لتفصيل الأفعال ونظهر تحسينات أداء كبيرة على خمسة مجموعات بيانات صعبة لتفصيل الأفعال. رمزنا البرمجي متاح على الرابط: https://github.com/ssarfraz/FINCH-Clustering/tree/master/TW-FINCH


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp