HyperAIHyperAI
منذ 2 أشهر

SegFace: تقسيم الوجوه للتصنيفات ذي الذيل الطويل

Narayan, Kartik ; VS, Vibashan ; Patel, Vishal M.
SegFace: تقسيم الوجوه للتصنيفات ذي الذيل الطويل
الملخص

تحليل الوجه يشير إلى التجزئة الدلالية لأجزاء الوجه البشري إلى مناطق وجهية رئيسية مثل العينين، الأنف، الشعر، إلخ. يعتبر هذا التحليل متطلبًا أساسيًا لتطبيقات متقدمة متنوعة، بما في ذلك تحرير الوجه، واستبدال الوجه، ووضع المكياج على الوجه، والتي غالبًا ما تتطلب أقنعة تجزئة للتصنيفات مثل النظارات الشمسية، القبعات، الأقراط والقلادات. هذه التصنيفات التي تظهر بشكل نادر تُعرف بالتصنيفات ذيلية طويلة (long-tail classes)، وهي التي تظل في الظل بسبب التصنيفات الأكثر ظهورًا المعروفة بالتصنيفات رأسية (head classes). الأساليب الحالية، التي تعتمد بشكل أساسي على الشبكات العصبية المتكررة (CNN)، تميل إلى أن تكون مهيمنة من قبل التصنيفات الرأسية أثناء التدريب، مما يؤدي إلى تمثيل غير مثالي للتصنيفات ذيلية طويلة. قد أغفلت الأعمال السابقة بشكل كبير مشكلة الأداء السيء للتجزئة للتصنيفات ذيلية طويلة. لمعالجة هذه المشكلة، نقترح SegFace، وهو نهج بسيط وكفؤ يستخدم نموذجًا خفيف الوزن يعتمد على المحول (transformer) والذي يستفيد من الرموز القابلة للتعلم الخاصة بكل تصنيف. يقوم محول الفكoder باستغلال الرموز الخاصة بكل تصنيف، مما يسمح لكل رمز بالتركيز على فئته المقابلة وبالتالي تمكين النمذجة المستقلة لكل فئة. يحسن النهج المقترح أداء الفئات ذيلية طويلة، مما يعزز الأداء العام. حسب علمنا,则SegFace هو أول عمل يستخدم نماذج المحولات (transformer models) لتحليل الوجه. بالإضافة إلى ذلك,يمكن تكييف نهجنا للأجهزة الحوافية ذات الحساب المنخفض (low-compute edge devices),مع تحقيق معدل 95.96 إطارًا في الثانية (FPS). قمنا بإجراء تجارب واسعة النطاق تثبت أن SegFace يتفوق بشكل كبير على النماذج الرائدة سابقًا، حيث حقق متوسط درجة F1 بمقدار 88.96 (+2.82) على مجموعة بيانات CelebAMask-HQ ومتوسط درجة F1 بمقدار 93.03 (+0.65) على مجموعة بيانات LaPa. الكود: https://github.com/Kartik-3004/SegFace请注意,由于阿拉伯语是从右向左书写的,所以链接和数字等需要从右向左排列。在实际应用中,链接通常会保持从左到右的书写顺序以方便点击。因此,在这里我保留了链接的原始书写方向。