HyperAIHyperAI

Command Palette

Search for a command to run...

المحولات العابرة الزمنية-العلاقية للتمييز القائم على أمثلة قليلة للإجراءات

Toby Perrett Alessandro Masullo Tilo Burghardt Majid Mirmehdi Dima Damen

الملخص

نُقدِّم نهجًا جديدًا للتعرف على الإجراءات بعينة قليلة، من خلال العثور على أزواج الإطارات المتناظرة زمنيًا بين الاستعلام والفيديوهات في مجموعة الدعم. على عكس الطرق السابقة في التعلم بعينة قليلة، نبني نماذج فئات باستخدام آلية الانتباه في CrossTransformer لرصد التسلسلات الجزئية ذات الصلة لجميع الفيديوهات في مجموعة الدعم، بدلًا من استخدام المتوسطات الفئوية أو التطابق الأفضل وحيدًا. تُكوَّن تمثيلات الفيديو من مجموعات مرتبة من عدد متغير من الإطارات، مما يسمح بمقارنة التسلسلات الجزئية للإجراءات بسرعات مختلفة والانزياحات الزمنية المختلفة.تحقيقًا لنتائج متميزة على مقاييس التعلم بعينة قليلة لـ Kinetics، Something-Something V2 (SSv2)، HMDB51، وUCF101، تُظهر نماذج CrossTransformer ذات العلاقة الزمنية (TRX) التي اقترحناها تفوقًا على أحدث النتائج المنشورة. وبشكل خاص، تتفوق طريقة نهجنا على الطرق السابقة على مجموعة SSv2 بفارق كبير (12%)، وذلك بفضل قدرتها على نمذجة العلاقات الزمنية. كما يُظهر التحليل التجريبي التفصيلي أهمية التماثل مع عدة فيديوهات من مجموعة الدعم، بالإضافة إلى أهمية تعلُّم CrossTransformer ذات العلاقات من الدرجة العليا.


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp