HyperAIHyperAI
منذ 2 أشهر

شبكة تجميع متعددة الآراء لتقسيم الصور الثنائية

Yu, Qian ; Zhao, Xiaoqi ; Pang, Youwei ; Zhang, Lihe ; Lu, Huchuan
شبكة تجميع متعددة الآراء لتقسيم الصور الثنائية
الملخص

التمييز الثنائي للفصل في الصور (Dichotomous Image Segmentation - DIS) بدأ مؤخرًا في الظهور لتحقيق فصل كائنات عالي الدقة من صور طبيعية ذات دقة عالية. عند تصميم نموذج DIS فعال، تحدي الرئيسي هو كيفية توازن التشتت الدلالي لأهداف ذات دقة عالية في المجال الاستقبالي الصغير والخسارة في التفاصيل ذات الدقة العالية في المجال الاستقبالي الكبير. تعتمد الأساليب الحالية على مسارات ومراحل متعددة ومتشعبة للترميز والفك لتكميل التحديد العالمي والتكرار المحلي تدريجيًا.نظام الرؤية البشري يلتقط المناطق ذات الاهتمام من خلال مراقبتها من زوايا متعددة. مستوحىً من هذا النظام، نقوم بنمذجة DIS كمشكلة إدراك كائنات متعددة الزوايا ونقدم شبكة تجميع متعددة الزوايا (Multi-View Aggregation Network - MVANet)، والتي توحد دمج الميزات بين المنظر البعيد والمنظر القريب في مسار واحد بهيكلية واحدة للترميز والفك. بمساعدة الوحدات المقترحة للتكميم المتعدد للزوايا والتكرار، أقام نهجنا تفاعلات بصرية طويلة المدى ومعمقة عبر زوايا متعددة، مما سمح لميزات المنظر القريب بالتركيز على الهياكل الرقيقة للغاية.أظهرت التجارب على مجموعة البيانات الشهيرة DIS-5K أن شبكتنا MVANet تتفوق بشكل كبير على أفضل الأساليب الحالية من حيث الدقة والسرعة. سيتم توفير الكود المصدر ومجموعات البيانات بشكل عام على الرابط \href{https://github.com/qianyu-dlut/MVANet}{MVANet}.