HyperAIHyperAI
منذ 11 أيام

LiteSeg: شبكة تلافيف خفيفة الوزن جديدة للفصل الدلالي

Taha Emara, Hossam E. Abd El Munim, Hazem M. Abbas
LiteSeg: شبكة تلافيف خفيفة الوزن جديدة للفصل الدلالي
الملخص

تُعد التجزئة الدلالية للصورة دورًا محوريًا في العديد من التطبيقات البصرية، بما في ذلك القيادة الذاتية وتحليل الصور الطبية. ومعظم النماذج السابقة اتجهت نحو تحسين الأداء من حيث الدقة، مع اهتمام محدود بالكفاءة الحسابية. في هذا البحث، نقدم نموذج "LiteSeg"، وهو بنية خفيفة الوزن مخصصة للتجميع الدلالي للصورة. وفي هذا العمل، نستكشف نسخة أعمق من وحدة التجميع الهرمي المكاني بمسافات مُتعددة (ASPP)، ونطبّق روابط تلافيف قصيرة وطويلة، بالإضافة إلى التحويلات التباديلية العميقة، مما يؤدي إلى نموذج أسرع وأكثر كفاءة. تم تقديم معمارية LiteSeg واختبارها باستخدام عدة شبكات أساسية، مثل Darknet19 وMobileNet وShuffleNet، لتوفير توازنات متعددة بين الدقة والتكلفة الحسابية. وقد حقق النموذج المقترح LiteSeg، باستخدام MobileNetV2 كشبكة أساسية، دقة قدرها 67.81% من متوسط التداخل على المقطع (mIoU) بسرعة 161 إطارًا في الثانية، وبدقة 640×360 على مجموعة بيانات Cityscapes.

LiteSeg: شبكة تلافيف خفيفة الوزن جديدة للفصل الدلالي | أحدث الأوراق البحثية | HyperAI