HyperAIHyperAI

Command Palette

Search for a command to run...

MITFAS: محاذاة وعينة الميزات الزمنية القائمة على المعلومات المتبادلة للتعرف على الإجراءات في الفيديو الجوي

Ruiqi Xian Xijun Wang Dinesh Manocha

الملخص

نقدم نهجًا جديدًا للتعرف على الحركات في مقاطع الفيديو التي تسجلها الطائرات بدون طيار (UAV). تم تصميم صيغتنا لمعالجة الازدحام والانحرافات في الزاوية الناتجة عن حركة الطائرة بدون طيار. نستخدم مفهوم المعلومات المتبادلة لحساب ومحاذاة المناطق المرتبطة بالحركة البشرية أو الحركات في المجال الزمني. هذا يمكّن نموذج التعرف لدينا من التعلم من الميزات الأساسية المرتبطة بالحركة. كما نقترح طريقة جديدة لاستخلاص الإطارات (frame sampling) تعتمد على المعلومات المتبادلة المشتركة لاستخلاص التسلسل الأكثر إفادة من الإطارات في مقاطع الفيديو الخاصة بالطائرات بدون طيار. وقد قمنا بدمج نهجنا مع نموذج X3D وقيّمنا الأداء على عدة مجموعات بيانات. في الممارسة العملية، حققنا تحسنًا بنسبة 18.9٪ في دقة الدرجة الأولى (Top-1 accuracy) مقارنةً بالأساليب الحالية الأفضل في مجالها على مجموعة بيانات UAV-Human (Li et al., 2021)، وتحسنًا بنسبة 7.3٪ على مجموعة بيانات Drone-Action (Perera et al., 2019)، وتحسنًا بنسبة 7.16٪ على مجموعة بيانات NEC Drones (Choi et al., 2020).


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp