HyperAIHyperAI

Command Palette

Search for a command to run...

منذ 4 أشهر

شبكة ت(Convolutional) زمنية منفصلة عميقة لتقسيم الحركات

{Heiko Neumann Wolfgang Mader Christian Jarvers Basavaraj Hampiholi}

الملخص

التحليل الدقيق للزمن في الأفعال داخل مقاطع الفيديو الطويلة وغير المُعدّلة بالألوان (RGB) يُعد موضوعًا رئيسيًا في التفاعل البصري بين الإنسان والآلة. تستخدم الطرق الحديثة القائمة على التحويل الزمني إما بنية المُشفّر-المُفكّك (ED) أو التوسيع (dilations) بعامل مُضاعف في طبقات التحويل المتتالية لتقسيم الأفعال في الفيديوهات. ومع ذلك، تعمل شبكات ED على دقة زمنية منخفضة، كما أن التوسيع في الطبقات المتتالية يسبب مشكلة تُعرف بـ "آثار الشبكة" (gridding artifacts). نقترح شبكة التحويل الزمني المفصّل بعمق (DS-TCN) التي تعمل على الدقة الزمنية الكاملة وتقلل من تأثيرات الشبكة. يُشكّل المُكوّن الأساسي لـ DS-TCN كتلة التوسيع العميقي المتكررة (RDDB). ونستكشف التوازن بين استخدام كيرنيلات كبيرة ونِسَب توسيع صغيرة باستخدام RDDB. ونُظهر أن DS-TCN قادرة على التقاط الاعتماديات الطويلة الأمد والدلائل الزمنية المحلية بكفاءة. كما أظهرت تقييماتنا على ثلاث مجموعات معيارية (GTEA، 50Salads، Breakfast) أن DS-TCN تتفوّق على النماذج القائمة على ED-TCN والأساليب القائمة على التوسيع، حتى مع عدد أقل من المعاملات المُقارنة.

المعايير القياسية

معيار قياسيالمنهجيةالمقاييس
action-segmentation-on-50-salads-1DS-TCN
Acc: 80.0
Edit: 70.0
F1@10%: 77.0
F1@25%: 74.43
F1@50%: 65.78
action-segmentation-on-breakfast-1DS-TCN
Acc: 70.75
Average F1: 59.6
Edit: 69.02
F1@10%: 67.70
F1@25%: 62.05
F1@50%: 49.18
action-segmentation-on-gtea-1DS-TCN
Acc: 78.10
Edit: 84.05
F1@10%: 88.30
F1@25%: 85.44
F1@50%: 72.84

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — عجّل تطوير الذكاء الاصطناعي الخاص بك من خلال البرمجة المشتركة المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة المشتركة بالذكاء الاصطناعي
وحدات معالجة رسومات جاهزة
أفضل الأسعار
ابدأ الآن

Hyper Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp
شبكة ت(Convolutional) زمنية منفصلة عميقة لتقسيم الحركات | الأوراق البحثية | HyperAI