HyperAIHyperAI
منذ 11 أيام

RPT: تعلّم تمثيل مجموعة النقاط للتعقب البصري السيماسي

Ziang Ma, Linyuan Wang, Haitao Zhang, Wei Lu, Jun Yin
RPT: تعلّم تمثيل مجموعة النقاط للتعقب البصري السيماسي
الملخص

رغم التقدم الكبير المحرز في التتبع البصري المقاوم، تبقى عملية تقدير حالة الهدف بدقة مشكلةً صعبة للغاية. في هذه الورقة، نجادل بأن هذه المشكلة مرتبطة ارتباطًا وثيقًا بالتمثيل الشائع المتمثل في مربع الحدود (bounding box)، والذي يوفر فقط معلومات خشنة عن الحدود المكانية للكائن. لذلك، نقترح إطارًا فعّالًا للتعقب البصري يُقدّم تقديرًا دقيقًا لحالة الهدف باستخدام تمثيل أكثر دقة، متمثلًا في مجموعة من النقاط الممثلة. تُدرّب هذه المجموعة من النقاط لتمثيل المواقع ذات المعنى المعجمي والهندسي المهمة داخل منطقة الهدف، مما يمكّن من تحسين دقة التموضع وتحسين نمذجة مظهر الكائن. علاوةً على ذلك، نقترح استراتيجية تجميع متعددة المستويات للحصول على معلومات تفصيلية حول البنية من خلال دمج طبقات التحويل التلقائي الهرمية. أظهرت التجارب الواسعة على عدة معايير صعبة، تشمل OTB2015 وVOT2018 وVOT2019 وGOT-10k، أن طريقتنا تحقق أداءً جديدًا من أفضل الأداءات الحالية، مع تشغيل بسرعة تزيد عن 20 إطارًا في الثانية.

RPT: تعلّم تمثيل مجموعة النقاط للتعقب البصري السيماسي | أحدث الأوراق البحثية | HyperAI