{ Martin Jagersand Masood Dehghan Chao Gao Chenyang Huang Zichen Zhang Xuebin Qin}

الملخص
تم اعتماد الشبكات العصبية التلافيفية العميقة (Deep Convolutional Neural Networks) للكشف عن الكائنات البارزة، وقد حققت أداءً يُعدّ الأفضل في مجالها. ومع ذلك، تركز معظم الدراسات السابقة على الدقة الإقليمية دون الاهتمام بجودة الحدود. في هذه الورقة، نقترح معمارية تُسمى BASNet، تُعتمد على نموذج التنبؤ والتحسين (predict-refine)، إلى جانب خسارة هجينة جديدة مُصممة للكشف عن الكائنات البارزة مع الانتباه للحدود (Boundary-Aware Salient Object Detection). بشكل محدد، تتكون المعمارية من شبكة مشفرة-فكّر متصلة بشكل كثيف (Densely Supervised Encoder-Decoder) ووحدة تحسين تلافيفية (Residual Refinement Module)، حيث تتحمل الأولى مسؤولية التنبؤ بالكائنات البارزة، بينما تُعنى الثانية بتحسين خريطة البارزية. أما الخسارة الهجينة، فهي توجه الشبكة لتعلم التحويل بين الصورة المدخلة والصورة الحقيقية (Ground Truth) عبر هيكل ثلاثي المستويات: المستوى البكسي (Pixel)، والمستوى الجزئي (Patch)، والمستوى الخريطة (Map)، وذلك من خلال دمج خسائر التباين الثنائي (Binary Cross Entropy - BCE)، ومؤشر التشابه الهيكلي (Structural Similarity - SSIM)، ومؤشر التقاطع على الاتحاد (Intersection-over-Union - IoU). وبفضل استخدام هذه الخسارة الهجينة، تُصبح المعمارية المقترحة قادرة على تقسيم مناطق الكائنات البارزة بكفاءة، وتمييز الهياكل الدقيقة بدقة مع الحفاظ على حدود واضحة. أظهرت النتائج التجريبية على ستة مجموعات بيانات عامة أن طريقةنا تتفوّق على الطرق الحالية في الأداء، سواء من حيث مقاييس التقييم الإقليمي أو الحدودي. كما تعمل طريقةنا بسرعة تزيد عن 25 إطارًا في الثانية (fps) على وحدة معالجة واحدة (GPU). يمكن الوصول إلى الكود المصدري عبر الرابط التالي: https://github.com/NathanUA/BASNet.
المعايير القياسية
| معيار قياسي | المنهجية | المقاييس |
|---|---|---|
| camouflaged-object-segmentation-on-camo | BASNet | MAE: 0.159 S-Measure: 0.618 Weighted F-Measure: 0.413 |
| camouflaged-object-segmentation-on-cod | BASNet | MAE: 0.092 S-Measure: 0.685 Weighted F-Measure: 0.352 |
| camouflaged-object-segmentation-on-pcod-1200 | BASNet | S-Measure: 0.837 |
| dichotomous-image-segmentation-on-dis-te1 | BASNet | E-measure: 0.801 HCE: 220 MAE: 0.084 S-Measure: 0.754 max F-Measure: 0.688 weighted F-measure: 0.595 |
| dichotomous-image-segmentation-on-dis-te2 | BASNet | E-measure: 0.836 HCE: 480 MAE: 0.084 S-Measure: 0.786 max F-Measure: 0.755 weighted F-measure: 0.668 |
| dichotomous-image-segmentation-on-dis-te3 | BASNet | E-measure: 0.856 HCE: 948 MAE: 0.083 S-Measure: 0.798 max F-Measure: 0.785 weighted F-measure: 0.696 |
| dichotomous-image-segmentation-on-dis-te4 | BASNet | E-measure: 0.848 HCE: 3601 MAE: 0.091 S-Measure: 0.794 max F-Measure: 0.780 weighted F-measure: 0.693 |
| dichotomous-image-segmentation-on-dis-vd | BASNet | E-measure: 0.816 HCE: 1402 MAE: 0.094 S-Measure: 0.768 max F-Measure: 0.731 weighted F-measure: 0.641 |
| salient-object-detection-on-dut-omron | BASNet | MAE: 0.056 |
| salient-object-detection-on-duts-te | BASNet | MAE: 0.047 S-Measure: 0.876 mean E-Measure: 0.896 mean F-Measure: 0.823 |
| salient-object-detection-on-ecssd | BASNet | MAE: 0.037 |
| salient-object-detection-on-hku-is | BASNet | MAE: 0.032 |
| salient-object-detection-on-pascal-s | BASNet | MAE: 0.076 |
| salient-object-detection-on-soc | BASNet | Average MAE: 0.092 S-Measure: 0.841 mean E-Measure: 0.864 |
| salient-object-detection-on-sod | BASNet | MAE: 0.114 |
بناء الذكاء الاصطناعي بالذكاء الاصطناعي
من الفكرة إلى الإطلاق — عجّل تطوير الذكاء الاصطناعي الخاص بك من خلال البرمجة المشتركة المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.