HyperAIHyperAI

Command Palette

Search for a command to run...

ODTrack: التعلم الكثيف للرموز الزمنية عبر الإنترنت لمتابعة الصور البصرية

Yaozong Zheng Bineng Zhong* Qihua Liang Zhiyi Mo Shengping Zhang Xianxian Li

الملخص

الاستدلال السياقي عبر الإنترنت والربط بين الإطارات الفيديوية المتتالية أمر حاسم لفهم الحالات في تتبع الصور المرئية. ومع ذلك، فإن معظم المتعقبين الرائدين حاليًا يعتمدون بشكل مستمر على العلاقات الزمنية النادرة بين الإطارات المرجعية وإطارات البحث من خلال وضع غير متصل بالإنترنت. نتيجة لذلك، يمكنهم التفاعل بشكل مستقل فقط داخل كل زوج صور وإقامة علاقات زمنية محدودة. لحل هذه المشكلة، نقترح أنبوب تتبع على مستوى الفيديو بسيط ومرن وفعال، يُسمى \textbf{ODTrack}، والذي يربط العلاقات السياقية للإطارات الفيديوية بكثافة بطريقة انتشار الرموز عبر الإنترنت. يتلقى ODTrack إطارات فيديو ذات طول تعسفي لتقاطع العلاقات المساحة-زمن للحالة، ويضغط خصائص التمييز (معلومات التوضع) للهدف إلى سلسلة رموز لتحقيق الربط بين الإطارات. تجلب هذه الحل الجديد الفوائد التالية: 1) يمكن أن تخدم السلسلات الرمزية النقية كحافزات لل揄سبا في الإطار الفيديوي التالي، مما يستفيد من المعلومات السابقة لإرشاد الاستدلال المستقبلي؛ 2) يتم تجنب استراتيجيات التحديث عبر الإنترنت المعقدة بفعالية من خلال انتشار سلاسل الرموز بشكل تكراري، وبالتالي يمكننا تحقيق تمثيل نموذج أكثر كفاءة وحساب أسرع. حقق ODTrack أداءً جديدًا \textit{SOTA} على سبعة مقاييس قياسية بينما يعمل بسرعة الوقت الحقيقي. يمكن الحصول على الكود والنماذج من \url{https://github.com/GXNU-ZhongLab/ODTrack}.


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp