شبكة متسلسلة من الطرف إلى الطرف لبحث فعّال عن الأشخاص

يهدف البحث عن الأشخاص إلى حل مسألتي الكشف عن الأشخاص وإعادة التعرف عليهم (re-ID) معًا. وقد صممت الدراسات الحالية شبكات نهائية نهائية قائمة على Faster R-CNN. ومع ذلك، نظرًا للبنية المتوازية لـ Faster R-CNN، فإن الميزات المستخرجة تنبع من اقتراحات منخفضة الجودة تولّدها شبكة اقتراح المناطق (Region Proposal Network)، بدلًا من الصناديق المحددة عالية الجودة الناتجة عن عملية الكشف. ونظرًا لأن البحث عن الأشخاص مسألة دقيقة جدًا، فإن هذه الميزات الضعيفة تؤدي إلى تراجع كبير في أداء إعادة التعرف. ولحل هذه المشكلة، نقترح شبكة نهائية متسلسلة (SeqNet) لاستخراج ميزات عالية الجودة. في SeqNet، تُنظر إلى عملية الكشف وإعادة التعرف على أنها عملية متسلسلة، وتُعالج بواسطة شبكتين فرعيتين بشكل متتابع. علاوةً على ذلك، قمنا بتصميم خوارزمية مطابقة ثنائية الرسم البياني القوية (CBGM) لاستغلال المعلومات السياقية بشكل فعّال كمصدر مكمل مهم لتوحيد الأشخاص. وقد أظهرت التجارب الواسعة على معياري البحث عن الأشخاص المستخدمين على نطاق واسع، وهما CUHK-SYSU وPRW، أن طريقة العمل لدينا تحقق نتائج متميزة على مستوى الحد الأدنى من الأداء. كما تعمل نموذجنا بسرعة 11.5 إطارًا في الثانية على وحدة معالجة رسومية واحدة، ويمكن دمجه بسهولة في الإطار النهائي الحالي القائم على الشبكة النهائية.