HyperAIHyperAI
منذ 7 أيام

البحث الفعّال عن الأشخاص: نهج خالٍ من المُثبتات

Yichao Yan, Jinpeng Li, Jie Qin, Shengcai Liao, Xiaokang Yang
البحث الفعّال عن الأشخاص: نهج خالٍ من المُثبتات
الملخص

تهدف مهمة البحث عن الأشخاص إلى تحديد موقع شخص محدد في صور واقعية غير مقطوعة وتحديد هويته في آن واحد. لتحقيق هذا الهدف، تعتمد النماذج الحديثة على أحدث التقنيات بإضافة فرع إعادة التعرف (re-id) إلى كاشفات ثنائية المراحل مثل Faster R-CNN. وبفضل عملية ROI-Align، تحقق هذه البنية المعمارية دقة متميزة، حيث يتم توجيه ميزات إعادة التعرف بشكل صريح إلى المناطق المقابلة للكائنات، ولكن في الوقت نفسه، تؤدي إلى عبء حسابي مرتفع ناتج عن كثافة مكائن الكائنات (object anchors). في هذا العمل، نقدّم نهجًا خالياً من المكائن (anchor-free) لمعالجة هذه المهمة الصعبة بكفاءة، من خلال اعتماد التصميمات التالية. أولاً، نختار كاشفًا خالياً من المكائن (مثل FCOS) كنموذج أساسي لهيكلنا. وبسبب غياب مكائن الكائنات الكثيفة، يظهر هذا الكاشف كفاءة أعلى بشكل ملحوظ مقارنة بالنماذج الحالية للبحث عن الأشخاص. ثانيًا، عند تكييف هذا الكاشف الخالي من المكائن مباشرةً لمهمة البحث عن الأشخاص، تظهر عدة تحديات رئيسية في تعلم ميزات إعادة التعرف القوية، والتي نلخّصها في مشاكل عدم التماثل على مستويات مختلفة (أي: الحجم، المنطقة، المهمة). لمعالجة هذه التحديات، نقترح وحدة تجميع ميزات متماثلة (aligned feature aggregation module) لتكوين تمثيلات ميزات أكثر تمييزًا وموثوقية. وبذلك نسمي نموذجنا بشبكة البحث عن الأشخاص المتماثلة للسمات (Feature-Aligned Person Search Network، أو AlignPS). ثالثًا، من خلال دراسة المزايا المتميزة لكل من النماذج القائمة على المكائن والخالية منها، نعزز نموذج AlignPS بإضافة رأس (head) يعتمد على ROI-Align، مما يحسن بشكل كبير من ثبات ميزات إعادة التعرف مع الحفاظ على كفاءة عالية في النموذج. أظهرت التجارب الواسعة التي أُجريت على مBenchmarkين صعبين (أي CUHK-SYSU وPRW) أن إطارنا يحقق أداءً متفوقًا أو تنافسيًا مقارنة بالأساليب الحالية، مع تميّزه بكفاءة أعلى. جميع أكواد المصدر، والبيانات، والنماذج المدربة متاحة عبر الرابط التالي: https://github.com/daodaofr/alignps.

البحث الفعّال عن الأشخاص: نهج خالٍ من المُثبتات | أحدث الأوراق البحثية | HyperAI