HyperAIHyperAI
منذ 2 أشهر

MambaVT: نمذجة سياقية زمانية ومكانية للتعقب الدقيق في البيئات RGB-T

Simiao Lai; Chang Liu; Jiawen Zhu; Ben Kang; Yang Liu; Dong Wang; Huchuan Lu
MambaVT: نمذجة سياقية زمانية ومكانية للتعقب الدقيق في البيئات RGB-T
الملخص

الخوارزميات الحالية للتعقب RGB-T قد أحرزت تقدماً ملحوظاً من خلال الاستفادة من قدرة التفاعل العالمية ونماذج التدريب المكثف للهيكل العظمي Transformer. ومع ذلك، فإن هذه الطرق تعتمد بشكل أساسي على مطابقة مظهر الصور الثنائية وتواجه تحديات التعقيد التربيعي الأصيل لآلية الانتباه، مما يؤدي إلى تقييد استغلال المعلومات الزمنية. مستوحاة من النموذج الفضائي الحالة Mamba الذي ظهر مؤخراً، والمعروف بقدراته الممتازة في نمذجة التتابعات الطويلة وتعقيده الحسابي الخطي، تقدم هذه الدراسة إطاراً قائماً بالكامل على Mamba (MambaVT) بهدف استغلال النمذجة السياقية الزمانية-المكانية بشكل كامل لتحقيق تعقب متين بين الرؤية البصرية والحرارية. وبشكل خاص، نصمم مكون دمج الإطارات عبر المسافات الطويلة لتكييف عالمي مع تغيرات مظهر الهدف، ونقدم إشارات المسار التاريخي قصير المدى لتوقع الحالات اللاحقة للهدف بناءً على أدلة الموقع الزمني المحلية. تظهر التجارب الواسعة إمكانات رؤية Mamba الهامة في التعقب RGB-T، حيث حقق MambaVT أفضل الأداء الحالي في أربعة مقاييس رئيسية بينما يتطلب تكاليف حسابية أقل. نهدف من خلال هذا العمل أن يكون بمثابة نقطة بداية بسيطة ولكنها قوية، لتحفيز البحث المستقبلي في هذا المجال. سيتم توفير الكود والنماذج المدربة مسبقاً.请注意,对于一些不太常见的术语,如“State Space Model Mamba”,我在翻译时保留了原文,以确保信息的完整性。如果您有特定的术语表或偏好,请告知我以便进一步优化翻译。

MambaVT: نمذجة سياقية زمانية ومكانية للتعقب الدقيق في البيئات RGB-T | أحدث الأوراق البحثية | HyperAI