جسر النقاط: التجزئة القليلة الامثلة بأي شيء بشكل معنوي بناءً على الرسم البياني

لقد أسهمت التطورات الحديثة في تقنيات التدريب المسبق على نطاق واسع في تعزيز القدرات النموذجية البنيوية البصرية بشكل كبير، لا سيما نموذج Segment Anything (SAM)، الذي يمكنه إنشاء أقنعة دقيقة استنادًا إلى مُدخلات نقطية أو صندوقية. وتمتد الدراسات الحديثة لتوسيع نطاق SAM في التجزئة الشاملة القليلة (Few-shot Semantic Segmentation - FSS)، مع التركيز على توليد المُدخلات (prompts) لتمكين التجزئة البصرية التلقائية القائمة على SAM. ومع ذلك، تعاني هذه الأساليب من صعوبات في اختيار المُدخلات المناسبة، وتتطلب إعدادات مُعلمة محددة لكل سيناريو مختلف، كما تُعاني من أوقات استجابة طويلة في حالة التجزئة الفردية (one-shot) بسبب الاستخدام المفرط لـ SAM، ما يؤدي إلى كفاءة منخفضة وقدرة محدودة على التلقائية. ولحل هذه المشكلات، نقترح منهجًا بسيطًا ولكن فعّالًا مبنيًا على تحليل الرسوم البيانية (graph analysis). على وجه التحديد، يُعدّ وحدة التوافق بين الإيجابي والسلبي (Positive-Negative Alignment) اختيارًا ديناميكيًا للمُدخلات النقطية لإنشاء الأقنعة، خصوصًا من خلال استغلال الوضع الخلفي كمرجع سلبي، مما يكشف عن إمكاناته الكامنة. وتكمل هذه العملية بوحدة تجميع النقاط والقناع (Point-Mask Clustering)، التي تُحدّد مستوى التفصيل للقناع والنقاط المختارة عبر تمثيلهم كرسم بياني موجه بناءً على تغطية القناع للنقاط. ثم تُجمّع هذه النقاط من خلال تحليل المكونات الضعيفة الاتصال في الرسم البياني الموجه بطريقة فعّالة، مما يُكوّن مجموعات طبيعية متميزة. وأخيرًا، تُستخدم وحدتا التحكم الإيجابية والانفجار الزائد (positive and overshooting gating) – اللتان تستفيدان من محاذاة مستوى التفصيل القائمة على الرسوم البيانية – لدمج الأقنعة ذات الثقة العالية وتصفية الأقنعة الزائفة (false-positive) للحصول على التنبؤ النهائي، مما يقلل من الحاجة إلى مُعلمات إضافية ويعزز كفاءة إنشاء القناع. وقد أثبتت التحليلات التجريبية الواسعة على مجموعات بيانات FSS القياسية، والتجزئة الجزئية الفردية (One-shot Part Segmentation)، والتجزئة عبر المجالات (Cross Domain FSS)، فعالية وكفاءة المنهج المقترح، حيث تفوق النماذج الرائدة في المجال العام، بتحقيق متوسط دقة IoU (mIoU) بلغ 58.7% على COCO-20i و35.2% على LVIS-92i. يُمكن الاطلاع على الكود المصدر في: https://andyzaq.github.io/GF-SAM/.