HyperAIHyperAI
منذ 17 أيام

EPYNET: شبكة هرمية فعّالة لتقسيم الملابس

{Heitor Silvério Lopes, Andrei De Souza Inácio}
الملخص

السمات البيولوجية الناعمة المستخرجة من جسم الإنسان، مثل نوع الملابس، لون الشعر، والإكسسوارات، تمثل معلومات مفيدة تُستخدم في تتبع الأشخاص وتحديد هويتهم. لا يزال التصنيف الدلالي لهذه السمات من الصور تحديًا كبيرًا للباحثين نظرًا لتنوع كبير في أنماط الملابس، والطبقات، والأحجام، والألوان. ولحل هذه المشكلات، قمنا بطرح إطار عمل يُسمى EPYNET مخصصًا لتصنيف الملابس. يعتمد إطار EPYNET على مكتشف الصنف الواحد متعدد الصناديق (SSD) وشبكة الهرم المميز (FPN)، مع استخدام نموذج EfficientNet كعمود فقري. كما يدمج الإطار تقنيات تعزيز البيانات وتقنيات تقليل الضوضاء لزيادة دقة التصنيف. بالإضافة إلى ذلك، قمنا بطرح مجموعة بيانات جديدة تُسمى UTFPR-SBD3، وتشمل 4500 صورة تم تسميتها يدويًا إلى 18 فئة من الكائنات، بالإضافة إلى الخلفية. على عكس المجموعات العامة المتاحة التي تعاني من توزيع غير متوازن بين الفئات، فإن مجموعة UTFPR-SBD3 تحتوي على ما لا يقل عن 100 مثال لكل فئة، بهدف تقليل صعوبة تدريب نماذج التعلم العميق. وقد قدمنا مقياسًا جديدًا لتوازن مجموعة البيانات، مستوحى من الصعوبة التي تواجه الباحثين عند مقارنة مجموعات بيانات مختلفة لتصنيف الملابس. وباستخدام هذا المقياس، أصبح من الممكن تحديد تأثير الخلفية، أو الفئات التي تحتوي على كائنات صغيرة، أو الفئات التي يتوفر فيها عدد زائد جدًا أو قليل جدًا من الأمثلة. أظهرت النتائج التجريبية على مجموعة UTFPR-SBD3 فعالية EPYNET، حيث تفوقت على الطرق الحالية الأفضل في مجال تصنيف الملابس على المجموعات العامة. وباستنادًا إلى هذه النتائج، نعتقد أن النهج المُقترح يمكن أن يكون مفيدًا بشكل محتمل في العديد من التطبيقات الواقعية المتعلقة بالسمات البيولوجية الناعمة، ورصد الأشخاص، ووصف الصور، وتوصية الملابس، وغيرها.