HyperAIHyperAI
منذ 2 أشهر

LinkNet: استغلال تمثيلات المُشفر للحصول على تقسيم دلالي كفء

Abhishek Chaurasia; Eugenio Culurciello
LinkNet: استغلال تمثيلات المُشفر للحصول على تقسيم دلالي كفء
الملخص

الترجمة إلى اللغة العربية:تتطلب تقسيم الصور شبه البكسل (Pixel-wise semantic segmentation) لفهم المشهد البصري أن يكون دقيقًا وفعالًا للحصول على أي استخدام في التطبيقات الفورية. رغم أن الخوارزميات الحالية دقيقة، إلا أنها لا تركز على الاستفادة من معلمات الشبكة العصبية بكفاءة. نتيجة لذلك، تكون هذه الخوارزميات ضخمة من حيث المعلمات والعمليات؛ وبالتالي بطيئة أيضًا. في هذا البحث، نقترح هندسة شبكة عصبية عميقة جديدة تسمح لها بالتعلم دون زيادة كبيرة في عدد المعلمات. تستعمل شبكتنا فقط 11.5 مليون معلمة و21.2 جيجافلوب (GFLOPs) لمعالجة صورة بدقة 3x640x360. تحقق أداءً رائدًا على مجموعة بيانات CamVid ونتائج مشابهة على مجموعة بيانات Cityscapes. كما نقارن وقت معالجة شبكتنا على بطاقات الرسوم NVIDIA والأجهزة المدمجة مع الهياكل الرائدة الحالية لدقات صور مختلفة.ملاحظة: تم استخدام الترجمة الأكثر شيوعاً للمصطلحات التقنية، مثل "جيجافلوب" لـ "GFLOPs". إذا كان هناك مصطلح غير شائع أو يحتاج إلى توضيح إضافي، فقد يتم وضع المصطلح الأصلي بين قوسين بعد الترجمة.