HyperAIHyperAI
منذ 2 أشهر

3C-Net: خسارة العد الفئوي ومركز الفئة لتحديد موقع الإجراءات بشكل ضعيف الإشراف

Sanath Narayan; Hisham Cholakkal; Fahad Shahbaz Khan; Ling Shao
3C-Net: خسارة العد الفئوي ومركز الفئة لتحديد موقع الإجراءات بشكل ضعيف الإشراف
الملخص

تحديد الأنشطة الزمنية هو مشكلة صعبة في مجال رؤية الحاسوب لها تطبيقات عديدة في العالم الحقيقي. تتطلب معظم الطرق الموجودة إشرافًا مفصلًا على مستوى الإطار لتدريب نماذج تحديد الأنشطة. في هذا البحث، نقترح إطارًا جديدًا يُسمى 3C-Net، والذي يحتاج فقط إلى إشراف على مستوى الفيديو (إشراف ضعيف) على شكل تصنيفات الأنشطة والعد المقابل لها. نقدم صياغة جديدة لتعلم خصائص الأنشطة التمييزية بقدرات تحديد زمني محسنة. تحتوي صياغتنا المشتركة على ثلاثة مصطلحات: مصطلح تصنيف لضمان قابلية فصل خصائص الأنشطة المُتعلمة، ومصطلح خسارة مركز متعدد العلامات معدل لتعزيز تمييز خصائص الأنشطة، ومصطلح خسارة العد لتحديد تسلسلات الأنشطة المجاورة، مما يؤدي إلى تحسين التحديد الزمني. أجريت تجارب شاملة على منصتين تحدييتين: THUMOS14 وActivityNet 1.2. يحدد نهجنا حالة جديدة للتقنية المتقدمة في تحديد الأنشطة الزمنية بإشراف ضعيف على كلاً من المجموعتين. وعلى مجموعة بيانات THUMOS14، حققت الطريقة المقترحة زيادة مطلقة بنسبة 4.6% من حيث الدقة المتوسطة (mAP) مقارنة بأحدث التقنيات المتقدمة. يمكن الوصول إلى الكود المصدر عبر الرابط: https://github.com/naraysa/3c-net.注释:- "Temporal action localization" 翻译为 "تحديد الأنشطة الزمنية"- "frame-level supervision" 翻译为 "إشراف على مستوى الإطار"- "video-level supervision" 翻译为 "إشراف على مستوى الفيديو"- "multi-label center loss" 翻译为 "خسارة مركز متعدد العلامات"- "mean average precision (mAP)" 翻译为 "الدقة المتوسطة (mAP)"- 机构名称如“THUMOS14”和“ActivityNet 1.2”保留原样。

3C-Net: خسارة العد الفئوي ومركز الفئة لتحديد موقع الإجراءات بشكل ضعيف الإشراف | أحدث الأوراق البحثية | HyperAI