HyperAIHyperAI
منذ 7 أيام

ترانسرييد: إعادة تحديد الكائنات المستندة إلى الترانسفورمر

Shuting He, Hao Luo, Pichao Wang, Fan Wang, Hao Li, Wei Jiang
ترانسرييد: إعادة تحديد الكائنات المستندة إلى الترانسفورمر
الملخص

استخلاص تمثيل مميز قوي يعد أحد التحديات الأساسية في إعادة التعرف على الكائنات (ReID). وعلى الرغم من النجاح الكبير الذي حققته الطرق القائمة على الشبكات العصبية التلافيفية (CNN)، إلا أنها تعالج جزءًا محليًا واحدًا في كل مرة، وتعاني من فقدان المعلومات التفصيلية الناتجة عن العمليات التلافيفية والتقليل (مثل التجميع والانزلاق التلافيفي). ولتجاوز هذه القيود، نقترح إطارًا جديدًا لـ ReID يعتمد بالكامل على المحولات (Transformer) يُسمى TransReID. بشكل محدد، نقوم أولاً بتمثيل الصورة كسلسلة من المربعات (patches)، ثم نبني قاعدة قوية قائمة على المحولات مع بعض التحسينات الجوهرية، والتي تحقق نتائج تنافسية على عدة معايير ReID مقارنة بالطرق القائمة على CNN. ولتعزيز التعلم القوي للمميزات في سياق المحولات بشكل أكبر، تم تصميم وحدتين جديدتين بعناية: (أ) وحدة ترتيب المربعات المُجزّأة (Jigsaw Patch Module - JPM)، التي تعيد ترتيب تمثيلات المربعات باستخدام عمليات النقل والخلط العشوائي للمربعات، ما ينتج مميزات قوية ذات قدرة تمييزية محسنة وتغطية أكثر تنوعًا. (ب) تم إدخال تمثيلات المعلومات الجانبية (Side Information Embeddings - SIE) لتقليص التحيز في المميزات تجاه التغيرات الناتجة عن الكاميرات أو الزوايا من خلال إدراج تمثيلات قابلة للتعلم لدمج هذه المؤشرات غير البصرية. إلى أفضل ما نعرف، هذه أول دراسة تُطبّق محولًا نقيًا في بحوث ReID. وتبين النتائج التجريبية لـ TransReID تفوقًا ملحوظًا، حيث تحقق أداءً رائدًا على مستويات عالمية في كل من معايير ReID للأشخاص والمركبات.

ترانسرييد: إعادة تحديد الكائنات المستندة إلى الترانسفورمر | أحدث الأوراق البحثية | HyperAI