HyperAIHyperAI
منذ 2 أشهر

SiamVGG: تتبع الصور باستخدام شبكات سيامية أعمق

Yuhong Li; Xiaofan Zhang; Deming Chen
SiamVGG: تتبع الصور باستخدام شبكات سيامية أعمق
الملخص

في الآونة الأخيرة، شهدنا تطورًا سريعًا في حلول تتبع الصور المرتكزة على الشبكات العصبية العميقة (DNN). بعض متعقبات الصور تجمع بين حلول DNN ومرشحات الارتباط التمييزية (DCF) لاستخراج الخصائص الدلالية وتقديم دقة تتبع متقدمة. ومع ذلك، فإن هذه الحلول تكون ذات كثافة حسابية عالية، مما يتطلب وقت معالجة طويل ويؤدي إلى أداء غير آمن في الوقت الحقيقي. لتقديم كل من الدقة العالية والأداء الزمني الحقيقي الموثوق، نقترح متعقبًا جديدًا يُسمى SiamVGG\footnote{https://github.com/leeyeehoo/SiamVGG}. يجمع هذا المتعقب بين هيكل شبكة عصبية ارتباطية (CNN) ومشغل الارتباط المتقاطع، ويستفيد من الخصائص المستخرجة من الصور النموذجية لتحقيق تتبع أكثر دقة للأجسام. تم تعديل هندسة SiamVGG من VGG-16 بحيث يتم مشاركة المعلمات بين الصور النموذجية والإطارات الفيديو المرغوبة كمدخلات. نعرض أداء SiamVGG المقترح على مجموعات البيانات OTB-2013/50/100 و VOT 2015/2016/2017 مع تحقيق دقة متقدمة بينما يحافظ على أداء زمني حقيقي جيد بسرعة 50 إطارًا في الثانية عند تشغيله على بطاقة GTX 1080Ti. يمكن أن يصل تصميمنا إلى نسبة تداخل متوسطة متوقعة (EAO) أعلى بنسبة 2% مقارنة بـ ECO و C-COT في تحدي VOT2017.

SiamVGG: تتبع الصور باستخدام شبكات سيامية أعمق | أحدث الأوراق البحثية | HyperAI