HyperAIHyperAI

Command Palette

Search for a command to run...

الإدراك التكيفي للتتبع البصري الموحد متعدد الوسائط للأجسام

Xiantao Hu Bineng Zhong Qihua Liang Zhiyi Mo Liangtao Shi Ying Tai Jian Yang

الملخص

في الآونة الأخيرة، يُولِّي العديد من مُتَّبِعِي الوسائط المتعددة اهتمامًا كبيرًا بالصورة الملونة (RGB) كوسيلة مهيمنة، ويُعامل الوسائط الأخرى كوسائط مساعدة، مع إجراء تعديل دقيق منفصل لمهام الوسائط المتعددة المختلفة. هذه التوازن غير المتوازن في الاعتماد على الوسائط يُحد من قدرة الطرق على الاستفادة الديناميكية من المعلومات التكميلية المتوفرة في كل وسيلة في السياقات المعقدة، مما يجعل من الصعب الاستفادة الكاملة من المزايا التي تقدمها الوسائط المتعددة. نتيجة لذلك، يُعاني النموذج المُوحَّد للبارامترات غالبًا من الأداء الضعيف في مهام تتبع الوسائط المتعددة المختلفة. لمعالجة هذه المشكلة، نُقدِّم APTrack، وهو مُتَّبِع مُوحَّد جديد مُصمَّم لتمييز الوسائط المتعددة بشكل متكيف. على عكس الطرق السابقة، يستكشف APTrack تمثيلًا موحَّدًا من خلال استراتيجية تمثيل متساوية. تتيح هذه الاستراتيجية للنموذج التكيُّف الديناميكي مع مختلف الوسائط والمهام دون الحاجة إلى تعديل دقيق إضافي بين المهام المختلفة. علاوةً على ذلك، يُدمج في مُتَّبِعنا وحدة تفاعل وسائط متكيفة (AMI) تُسهم في ربط التفاعلات بين الوسائط بشكل فعّال من خلال إنشاء رموز قابلة للتعلم. أظهرت التجارب التي أُجريت على خمسة مجموعات بيانات متعددة الوسائط متنوعة (RGBT234، LasHeR، VisEvent، DepthTrack، وVOT-RGBD2022) أن APTrack لا يتجاوز المُتَّبِعين المُوحَّدين ذوي الأداء الرائد في الحدود الحالية في مجال التتبع متعدد الوسائط، بل يتفوّق أيضًا على المُتَّبِعين المصممين خصيصًا لمهام تتبع معينة متعددة الوسائط.


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp