HyperAIHyperAI
منذ 2 أشهر

ARTrackV2: تحفيز المُتابِع التلقائي على أين ينظر وكيف يصف

Yifan Bai; Zeyang Zhao; Yihong Gong; Xing Wei
ARTrackV2: تحفيز المُتابِع التلقائي على أين ينظر وكيف يصف
الملخص

نقدم ARTrackV2، الذي يدمج جانبي التتبع الرئيسيين: تحديد أين يجب البحث (التحديد المكاني) وكيفية وصف (تحليل المظهر) الكائن المستهدف عبر الإطارات الفيديوية. مع البناء على أساس سلفه، يوسع ARTrackV2 هذا المفهوم من خلال تقديم إطار عمل توليدي موحد لـ "استخراج" مسار الكائن و "إعادة سرد" مظهره بطريقة ذاتية الانحدار. يعزز هذا النهج منهجية مستمرة زمنياً تُشكل التطور المشترك للحركة والخصائص البصرية، بقيادة التقديرات السابقة. علاوة على ذلك، يبرز ARTrackV2 بفعاليته وبساطته، حيث يلغي الانحدار الذاتي الأقل كفاءة داخل الإطار والمعامِلات التي يتم ضبطها يدوياً لتحديث المظهر. رغم بساطته، فإن ARTrackV2 يحقق أداءً رائداً في مجموعات البيانات المرجعية السائدة ويُظهر تحسيناً فعالاً ملحوظاً. بشكل خاص، يصل ARTrackV2 إلى درجة AO قدرها 79.5٪ على GOT-10k، ودرجة AUC قدرها 86.1٪ على TrackingNet بينما يكون أسرع بمقدار 3.6 مرة من ARTrack. سيتم إصدار الكود.请注意,我已将百分比符号“%”转换为阿拉伯语中的百分比表示“٪”。如果需要保持英文符号,请告知。

ARTrackV2: تحفيز المُتابِع التلقائي على أين ينظر وكيف يصف | أحدث الأوراق البحثية | HyperAI