PP-LiteSeg: نموذج فائق للتصنيف الدلالي الزمني الحقيقي

تتطلب التطبيقات الواقعية طلبات عالية من أساليب التصنيف الدلالي. وعلى الرغم من التقدم الكبير الذي أحرزه التصنيف الدلالي بفضل التعلم العميق، فإن أداء الأساليب الزمنية الحقيقية لا يزال غير راضٍ. في هذه الدراسة، نُقدِّم نموذجًا خفيفًا جديدًا يُسمى PP-LiteSeg، مُصممًا خصيصًا لمهام التصنيف الدلالي في الزمن الحقيقي. بشكل خاص، نُقدِّم فكّاً مرناً وخفيفًا (FLD) لتقليل الحمل الحسابي الناتج عن الفكّات السابقة. ولتعزيز تمثيل الميزات، نُقدِّم وحدة تجميع انتباه موحدة (UAFM)، التي تستفيد من الانتباه المكاني والانتباه القناتي لإنتاج وزن، ثم تدمج الميزات المدخلة مع هذا الوزن. بالإضافة إلى ذلك، نُقدِّم وحدة تجميع هرمية بسيطة (SPPM) لتجميع السياق العالمي بتكلفة حسابية منخفضة. أظهرت التقييمات الواسعة أن PP-LiteSeg يحقق توازنًا متفوقًا بين الدقة والسرعة مقارنةً بالأساليب الأخرى. على مجموعة بيانات Cityscapes، حقق PP-LiteSeg 72.0% mIoU بسرعة 273.6 إطارًا في الثانية، و77.5% mIoU بسرعة 102.6 إطارًا في الثانية على وحدة معالجة الرسوميات NVIDIA GTX 1080Ti. يُمكن الوصول إلى الشيفرة المصدرية والنماذج عبر PaddleSeg: https://github.com/PaddlePaddle/PaddleSeg.