HyperAIHyperAI

Command Palette

Search for a command to run...

3C-Net: خسارة العد الفئوي ومركز الفئة لتحديد موقع الإجراءات بشكل ضعيف الإشراف

Sanath Narayan; Hisham Cholakkal; Fahad Shahbaz Khan; Ling Shao

الملخص

تحديد الأنشطة الزمنية هو مشكلة صعبة في مجال رؤية الحاسوب لها تطبيقات عديدة في العالم الحقيقي. تتطلب معظم الطرق الموجودة إشرافًا مفصلًا على مستوى الإطار لتدريب نماذج تحديد الأنشطة. في هذا البحث، نقترح إطارًا جديدًا يُسمى 3C-Net، والذي يحتاج فقط إلى إشراف على مستوى الفيديو (إشراف ضعيف) على شكل تصنيفات الأنشطة والعد المقابل لها. نقدم صياغة جديدة لتعلم خصائص الأنشطة التمييزية بقدرات تحديد زمني محسنة. تحتوي صياغتنا المشتركة على ثلاثة مصطلحات: مصطلح تصنيف لضمان قابلية فصل خصائص الأنشطة المُتعلمة، ومصطلح خسارة مركز متعدد العلامات معدل لتعزيز تمييز خصائص الأنشطة، ومصطلح خسارة العد لتحديد تسلسلات الأنشطة المجاورة، مما يؤدي إلى تحسين التحديد الزمني. أجريت تجارب شاملة على منصتين تحدييتين: THUMOS14 وActivityNet 1.2. يحدد نهجنا حالة جديدة للتقنية المتقدمة في تحديد الأنشطة الزمنية بإشراف ضعيف على كلاً من المجموعتين. وعلى مجموعة بيانات THUMOS14، حققت الطريقة المقترحة زيادة مطلقة بنسبة 4.6% من حيث الدقة المتوسطة (mAP) مقارنة بأحدث التقنيات المتقدمة. يمكن الوصول إلى الكود المصدر عبر الرابط: https://github.com/naraysa/3c-net.注释:- "Temporal action localization" 翻译为 "تحديد الأنشطة الزمنية"- "frame-level supervision" 翻译为 "إشراف على مستوى الإطار"- "video-level supervision" 翻译为 "إشراف على مستوى الفيديو"- "multi-label center loss" 翻译为 "خسارة مركز متعدد العلامات"- "mean average precision (mAP)" 翻译为 "الدقة المتوسطة (mAP)"- 机构名称如“THUMOS14”和“ActivityNet 1.2”保留原样。


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp