HyperAIHyperAI
منذ 17 أيام

تتبع الكائن باستخدام التعلم المعزز القائم على الشبكة السيماسية

{J. H. Baek, S. J. Hwang, S. J. Park}
الملخص

تُعدّ تتبع الكائنات تقنية لتعقب كائن معين يظهر في تسلسل فيديو مع مراقبة خصائصه أو تغيراته. في الآونة الأخيرة، ظهرت العديد من الخوارزميات ذات الأداء العالي من خلال تطبيق الشبكة السيماسية (Siamese network) في مجال تتبع الكائنات. تُصمم الشبكة السيماسية لتعلم التشابه بين صورتين. في تتبع الكائنات، يُتبع الكائن من خلال العثور على الموقع الأكثر تشابهًا مع الصورة المستهدفة في الصورة المُستعرضة. ومع ذلك، تُعدّ الخوارزميات القائمة على الشبكات السيماسية عرضة للإخفاء الجزئي أو الكلي للكائن. علاوةً على ذلك، وبما أن تتبع الكائن يتم باستخدام التشابه فقط مع الصورة المستمدة من مربع الحدود الحقيقي (ground-truth bounding box) للإطار الأول، فإن فقدان الكائن مرة واحدة يؤدي إلى تراكم الأخطاء، ما يسبب غالبًا حالة انحراف الكائن عن الهدف المطلوب. لذلك، في هذا البحث، نقترح نموذجًا يعتمد على التعلم المعزز (reinforcement learning) يمكنه تحقيق أعلى مكافأة ممكنة لنجاح التتبع بعد حدوث إخفاء جزئي أو كلي للكائن. كما نقترح أيضًا طريقة تبديل قوالب ديناميكية تستخدم قالبًا تم تتبعه بنجاح في إطار حديث لحل مشكلة الانحراف. عند تطبيق النموذج المقترح على النماذج الحالية لتقييم الأداء الكمي في معايير تتبع الكائنات البارزة VOT2018 وOTB50، تبين تحسين الدقة وتقليل عدد حالات الفشل مقارنة بالطرق السابقة. وفي النهاية، تم تحقيق دقة قدرها 0.618، ومتانة (Robustness) قدرها 0.234، ومساحة تداخل متوقعة متوسطة (EAO) قدرها 0.416 في VOT2018، بينما بلغت نسبة النجاح 0.673 والدقة 0.881 في OTB50.