HyperAIHyperAI
منذ 2 أشهر

W-TALC: تصنيف وتحديد الأنشطة الزمنية بشكل ضعيف الإشراف

Sujoy Paul; Sourya Roy; Amit K Roy-Chowdhury
W-TALC: تصنيف وتحديد الأنشطة الزمنية بشكل ضعيف الإشراف
الملخص

معظم طرق تحديد موقع النشاط في الأدبيات تعاني من عبء متطلب التسمية الإطارية (frame-wise annotation). قد يكون التعلم من العلامات الضعيفة حلاً محتملاً لتقليل هذا الجهد اليدوي في التسمية. شهدت السنوات الأخيرة تدفقًا كبيرًا للفيديوهات الموسومة على الإنترنت، والتي يمكن أن تشكل مصدرًا غنيًا بالبيانات التدريبية تحت إشراف ضعيف. بصفة خاصة، يمكن استخدام الارتباطات بين الفيديوهات ذات العلامات المشابهة لتحديد موقع النشاطات زمنيًا. لتحقيق هذا الهدف، نقدم W-TALC، وهو إطار عمل لتحديد موقع النشاطات الزمني والتصنيف تحت إشراف ضعيف باستخدام فقط علامات مستوى الفيديو (video-level labels). يمكن تقسيم الشبكة المقترحة إلى شبكتين فرعيتين، وهما شبكة استخراج الميزا من مجرىين (Two-Stream based feature extractor network) ووحدة تحت إشراف ضعيف، والتي نتعلمها عن طريق تحسين دالتين خسارة مكملتين. تظهر النتائج النوعية والكمية على قاعدتي بيانات صعبتين - Thumos14 وActivityNet1.2 - أن الطريقة المقترحة قادرة على اكتشاف النشاطات بدقة دقيقة وتتفوق على الأساليب الرائدة حاليًا.请注意,这里的人名和机构名称(如Thumos14和ActivityNet1.2)在阿拉伯语中通常保留其英文形式,以确保专业性和准确性。

W-TALC: تصنيف وتحديد الأنشطة الزمنية بشكل ضعيف الإشراف | أحدث الأوراق البحثية | HyperAI