HyperAIHyperAI

Command Palette

Search for a command to run...

ترانسرييد: إعادة تحديد الكائنات المستندة إلى الترانسفورمر

Shuting He Hao Luo Pichao Wang Fan Wang Hao Li Wei Jiang

الملخص

استخلاص تمثيل مميز قوي يعد أحد التحديات الأساسية في إعادة التعرف على الكائنات (ReID). وعلى الرغم من النجاح الكبير الذي حققته الطرق القائمة على الشبكات العصبية التلافيفية (CNN)، إلا أنها تعالج جزءًا محليًا واحدًا في كل مرة، وتعاني من فقدان المعلومات التفصيلية الناتجة عن العمليات التلافيفية والتقليل (مثل التجميع والانزلاق التلافيفي). ولتجاوز هذه القيود، نقترح إطارًا جديدًا لـ ReID يعتمد بالكامل على المحولات (Transformer) يُسمى TransReID. بشكل محدد، نقوم أولاً بتمثيل الصورة كسلسلة من المربعات (patches)، ثم نبني قاعدة قوية قائمة على المحولات مع بعض التحسينات الجوهرية، والتي تحقق نتائج تنافسية على عدة معايير ReID مقارنة بالطرق القائمة على CNN. ولتعزيز التعلم القوي للمميزات في سياق المحولات بشكل أكبر، تم تصميم وحدتين جديدتين بعناية: (أ) وحدة ترتيب المربعات المُجزّأة (Jigsaw Patch Module - JPM)، التي تعيد ترتيب تمثيلات المربعات باستخدام عمليات النقل والخلط العشوائي للمربعات، ما ينتج مميزات قوية ذات قدرة تمييزية محسنة وتغطية أكثر تنوعًا. (ب) تم إدخال تمثيلات المعلومات الجانبية (Side Information Embeddings - SIE) لتقليص التحيز في المميزات تجاه التغيرات الناتجة عن الكاميرات أو الزوايا من خلال إدراج تمثيلات قابلة للتعلم لدمج هذه المؤشرات غير البصرية. إلى أفضل ما نعرف، هذه أول دراسة تُطبّق محولًا نقيًا في بحوث ReID. وتبين النتائج التجريبية لـ TransReID تفوقًا ملحوظًا، حيث تحقق أداءً رائدًا على مستويات عالمية في كل من معايير ReID للأشخاص والمركبات.


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp