HyperAIHyperAI

Command Palette

Search for a command to run...

منذ 4 أشهر

تحسين تقسيم الإجراءات باستخدام تمثيلات فيديو هيراركية

{Dongheui Lee Hyemin Ahn}

تحسين تقسيم الإجراءات باستخدام تمثيلات فيديو هيراركية

الملخص

في هذه الورقة، نقترح نموذج التصحيح التسلسلي لتقسيم الأفعال (HASR)، الذي يمكنه تحسين نتائج تقسيم الأفعال الزمنية الناتجة عن نماذج مختلفة من خلال فهم السياق العام للفيديو المعطى بطريقة تسلسلية. عند تقدير نموذج الأساس (backbone) لتقسيم الأفعال لكيفية تقسيم الفيديو المعطى، يستخرج نموذجنا تمثيلات على مستوى القطع بناءً على السمات على مستوى الإطارات، ويستخرج تمثيلاً على مستوى الفيديو بناءً على التمثيلات على مستوى القطع. وباستناد إلى هذه التمثيلات التسلسلية، يمكن لنموذجنا الإشارة إلى السياق العام للفيديو بالكامل، وتوقع كيفية تصحيح التصنيفات الخاصة بالقطع التي لا تتماشى مع السياق. يمكن دمج HASR في مختلف نماذج تقسيم الأفعال (مثل MS-TCN، SSTDA، ASRF)، وتحسين أداء النماذج الرائدة بناءً على ثلاث مجموعات بيانات صعبة (GTEA، 50Salads، وBreakfast). على سبيل المثال، في مجموعة بيانات 50Salads، يرتفع مقياس التصحيح الجزئي من 67.9% إلى 77.4% (لـ MS-TCN)، ومن 75.8% إلى 77.3% (لـ SSTDA)، ومن 79.3% إلى 81.0% (لـ ASRF). بالإضافة إلى ذلك، يمكن لنموذجنا تحسين نتائج التقسيم الناتجة عن نموذج أساس غير معروف (unseen backbone)، والذي لم يُستخدم أثناء تدريب HASR. تُعد هذه القدرة على التعميم ميزة مهمة تجعل HASR أداة فعالة لتعزيز الطرق الحالية لتقسيم الأفعال الزمنية. يتوفر الكود الخاص بنا على الرابط التالي: https://github.com/cotton-ahn/HASR_iccv2021.

المعايير القياسية

معيار قياسيالمنهجيةالمقاييس
action-segmentation-on-50-salads-1ASRF + HASR
Acc: 83.9
Edit: 81.0
F1@10%: 86.6
F1@25%: 85.7
F1@50%: 78.5
action-segmentation-on-breakfast-1ASRF + HASR
Acc: 69.4
Average F1: 67.1
Edit: 71.9
F1@10%: 74.7
F1@25%: 69.5
F1@50%: 57.0
action-segmentation-on-gtea-1ASRF + HASR
Acc: 76.9
Edit: 84.5
F1@10%: 89.2
F1@25%: 87.2
F1@50%: 74.8
action-segmentation-on-gtea-1SSTDA + HASR
Acc: 78.7
Edit: 87.5
F1@10%: 90.9
F1@25%: 88.6
F1@50%: 76.4

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — عجّل تطوير الذكاء الاصطناعي الخاص بك من خلال البرمجة المشتركة المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة المشتركة بالذكاء الاصطناعي
وحدات معالجة رسومات جاهزة
أفضل الأسعار
ابدأ الآن

Hyper Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp
تحسين تقسيم الإجراءات باستخدام تمثيلات فيديو هيراركية | الأوراق البحثية | HyperAI