HyperAIHyperAI
منذ 4 أشهر

DynaSeg: طريقة الاندماج الديناميكي العميقة لتقسيم الصور بدون إشراف تدمج التشابه الخاص بالسمات والاستمرار المكاني

Boujemaa Guermazi; Naimul Khan
DynaSeg: طريقة الاندماج الديناميكي العميقة لتقسيم الصور بدون إشراف تدمج التشابه الخاص بالسمات والاستمرار المكاني
الملخص

يعالج عملنا التحدي الأساسي لتقسيم الصور في مجال الرؤية الحاسوبية، والذي يعتبر حاسمًا لمجموعة متنوعة من التطبيقات. رغم أن الطرق المراقبة تظهر كفاءة، إلا أن اعتمادها على شروحات بيكسلية واسعة النطاق يحد من قابلية التوسع. نقدم DynaSeg (دينا سيك)، وهو نهج جديد وغير مراقب لتقسيم الصور يتجاوز تحدي الموازنة بين تشابه الخصائص والاستمرارية المكانية دون الحاجة إلى ضبط متعدد المعلمات بشكل كبير. على عكس الطرق التقليدية، يستخدم DynaSeg نظام وزن ديناميكي يُحقق ضبط المعلمات تلقائيًا، ويتكيف بمرن مع خصائص الصورة، ويسهل دمجها مع شبكات تقسيم أخرى. من خلال إدخال مرحلة مؤشر السيلويت (Silhouette Score Phase)، يمنع DynaSeg فشل التقسيم القليل حيث قد تتقارب عدد المجموعات المتوقعة إلى واحدة. يستخدم DynaSeg استخراج الخصائص المستند إلى الشبكات العصبية التلافيفية (CNN) والشبكة العصبية ResNet المدربة مسبقًا، مما يجعله أكثر كفاءة حسابيًا وأبسط من النماذج المعقدة الأخرى. تظهر النتائج التجريبية أداءً رائدًا، حيث حقق تحسنًا بنسبة 12.2% و14.12% في متوسط تقاطع فوق الاتحاد (mIOU) مقارنة بالأساليب الحالية غير المراقبة لتقسيم الصور على مجموعة بيانات COCO-All وCOCO-Stuff على التوالي. نوفر نتائج نوعية وكمية على خمس مجموعات بيانات مرجعية، مما يثبت فعالية الأسلوب المقترح. يمكن الوصول إلى الكود عبر الرابط: https://github.com/RyersonMultimediaLab/DynaSeg