HyperAIHyperAI

Command Palette

Search for a command to run...

R-C3D: شبكة تلافيفية إقليمية ثلاثية الأبعاد لاكتشاف النشاط الزمني

Huijuan Xu Abir Das Kate Saenko

الملخص

نتناول مشكلة الكشف عن الأنشطة في تدفقات الفيديو المستمرة وغير المقصوصة. هذه مهمة صعبة تتطلب استخراج خصائص مكانية-زمانية ذات معنى لتقاطع الأنشطة، وتحديد أوقات بدء وانتهاء كل نشاط بدقة. نقدم نموذجًا جديدًا، وهو الشبكة ثلاثية الأبعاد الإقليمية للالتفاف (Region Convolutional 3D Network - R-C3D)، والذي يرمّز تدفقات الفيديو باستخدام شبكة الالتفاف الكاملة ثلاثية الأبعاد، ثم يولد مناطق زمنية مؤقتة تحتوي على أنشطة، وأخيرًا يقوم بتصنيف المناطق المختارة إلى أنشطة محددة. يتم توفير الحساب بسبب مشاركة خصائص الالتفاف بين خطوط العمل المقترحة والتصنيف. يتم تدريب النموذج بأكمله من البداية إلى النهاية مع خسائر تحدد وتصنف بشكل مشترك. يعتبر R-C3D أسرع من الأساليب الموجودة (569 إطارًا في الثانية على بطاقة Titan X Maxwell GPU واحدة) ويحقق أفضل النتائج المتاحة حاليًا على THUMOS'14. كما نثبت أن نموذجنا هو إطار عام للكشف عن الأنشطة لا يعتمد على افتراضات حول خصائص مجموعة البيانات الخاصة، وذلك بتقييم نهجنا على ActivityNet وCharades. رمز البرمجيات الخاص بنا متاح على الرابط http://ai.bu.edu/r-c3d/.


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp
R-C3D: شبكة تلافيفية إقليمية ثلاثية الأبعاد لاكتشاف النشاط الزمني | مستندات | HyperAI