منذ 6 أشهر

الملخص

لقد أسهمت التطورات الحديثة في تقنيات التدريب المسبق على نطاق واسع في تعزيز القدرات النموذجية البنيوية البصرية بشكل كبير، لا سيما نموذج Segment Anything (SAM)، الذي يمكنه إنشاء أقنعة دقيقة استنادًا إلى مُدخلات نقطية أو صندوقية. وتمتد الدراسات الحديثة لتوسيع نطاق SAM في التجزئة الشاملة القليلة (Few-shot Semantic Segmentation - FSS)، مع التركيز على توليد المُدخلات (prompts) لتمكين التجزئة البصرية التلقائية القائمة على SAM. ومع ذلك، تعاني هذه الأساليب من صعوبات في اختيار المُدخلات المناسبة، وتتطلب إعدادات مُعلمة محددة لكل سيناريو مختلف، كما تُعاني من أوقات استجابة طويلة في حالة التجزئة الفردية (one-shot) بسبب الاستخدام المفرط لـ SAM، ما يؤدي إلى كفاءة منخفضة وقدرة محدودة على التلقائية. ولحل هذه المشكلات، نقترح منهجًا بسيطًا ولكن فعّالًا مبنيًا على تحليل الرسوم البيانية (graph analysis). على وجه التحديد، يُعدّ وحدة التوافق بين الإيجابي والسلبي (Positive-Negative Alignment) اختيارًا ديناميكيًا للمُدخلات النقطية لإنشاء الأقنعة، خصوصًا من خلال استغلال الوضع الخلفي كمرجع سلبي، مما يكشف عن إمكاناته الكامنة. وتكمل هذه العملية بوحدة تجميع النقاط والقناع (Point-Mask Clustering)، التي تُحدّد مستوى التفصيل للقناع والنقاط المختارة عبر تمثيلهم كرسم بياني موجه بناءً على تغطية القناع للنقاط. ثم تُجمّع هذه النقاط من خلال تحليل المكونات الضعيفة الاتصال في الرسم البياني الموجه بطريقة فعّالة، مما يُكوّن مجموعات طبيعية متميزة. وأخيرًا، تُستخدم وحدتا التحكم الإيجابية والانفجار الزائد (positive and overshooting gating) – اللتان تستفيدان من محاذاة مستوى التفصيل القائمة على الرسوم البيانية – لدمج الأقنعة ذات الثقة العالية وتصفية الأقنعة الزائفة (false-positive) للحصول على التنبؤ النهائي، مما يقلل من الحاجة إلى مُعلمات إضافية ويعزز كفاءة إنشاء القناع. وقد أثبتت التحليلات التجريبية الواسعة على مجموعات بيانات FSS القياسية، والتجزئة الجزئية الفردية (One-shot Part Segmentation)، والتجزئة عبر المجالات (Cross Domain FSS)، فعالية وكفاءة المنهج المقترح، حيث تفوق النماذج الرائدة في المجال العام، بتحقيق متوسط دقة IoU (mIoU) بلغ 58.7% على COCO-20i و35.2% على LVIS-92i. يُمكن الاطلاع على الكود المصدر في: https://andyzaq.github.io/GF-SAM/.

ملف PDF المصدر

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي

وحدات GPU جاهزة للعمل

أفضل الأسعار

ابدأ عرض الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا

سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين

مدعوم بواسطة MailChimp

الملخص

Anqi Zhang Guangyu Gao Jianbo Jiao Chi Harold Liu Yunchao Wei

الملخص

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

HyperAI Newsletters

Anqi Zhang Guangyu Gao Jianbo Jiao Chi Harold Liu Yunchao Wei

الملخص

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

HyperAI Newsletters

Anqi Zhang Guangyu Gao Jianbo Jiao Chi Harold Liu Yunchao Wei

الملخص

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

HyperAI Newsletters

Command Palette

جسر النقاط: التجزئة القليلة الامثلة بأي شيء بشكل معنوي بناءً على الرسم البياني

Anqi Zhang Guangyu Gao Jianbo Jiao Chi Harold Liu Yunchao Wei

الملخص

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

HyperAI Newsletters

Command Palette

جسر النقاط: التجزئة القليلة الامثلة بأي شيء بشكل معنوي بناءً على الرسم البياني

Anqi Zhang Guangyu Gao Jianbo Jiao Chi Harold Liu Yunchao Wei

الملخص

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

HyperAI Newsletters

Command Palette

جسر النقاط: التجزئة القليلة الامثلة بأي شيء بشكل معنوي بناءً على الرسم البياني

Anqi Zhang Guangyu Gao Jianbo Jiao Chi Harold Liu Yunchao Wei

الملخص

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

HyperAI Newsletters