HyperAIHyperAI

Command Palette

Search for a command to run...

W-TALC: تصنيف وتحديد الأنشطة الزمنية بشكل ضعيف الإشراف

Sujoy Paul Sourya Roy Amit K Roy-Chowdhury

الملخص

معظم طرق تحديد موقع النشاط في الأدبيات تعاني من عبء متطلب التسمية الإطارية (frame-wise annotation). قد يكون التعلم من العلامات الضعيفة حلاً محتملاً لتقليل هذا الجهد اليدوي في التسمية. شهدت السنوات الأخيرة تدفقًا كبيرًا للفيديوهات الموسومة على الإنترنت، والتي يمكن أن تشكل مصدرًا غنيًا بالبيانات التدريبية تحت إشراف ضعيف. بصفة خاصة، يمكن استخدام الارتباطات بين الفيديوهات ذات العلامات المشابهة لتحديد موقع النشاطات زمنيًا. لتحقيق هذا الهدف، نقدم W-TALC، وهو إطار عمل لتحديد موقع النشاطات الزمني والتصنيف تحت إشراف ضعيف باستخدام فقط علامات مستوى الفيديو (video-level labels). يمكن تقسيم الشبكة المقترحة إلى شبكتين فرعيتين، وهما شبكة استخراج الميزا من مجرىين (Two-Stream based feature extractor network) ووحدة تحت إشراف ضعيف، والتي نتعلمها عن طريق تحسين دالتين خسارة مكملتين. تظهر النتائج النوعية والكمية على قاعدتي بيانات صعبتين - Thumos14 وActivityNet1.2 - أن الطريقة المقترحة قادرة على اكتشاف النشاطات بدقة دقيقة وتتفوق على الأساليب الرائدة حاليًا.请注意,这里的人名和机构名称(如Thumos14和ActivityNet1.2)在阿拉伯语中通常保留其英文形式,以确保专业性和准确性。


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp
W-TALC: تصنيف وتحديد الأنشطة الزمنية بشكل ضعيف الإشراف | مستندات | HyperAI