HyperAIHyperAI

Command Palette

Search for a command to run...

شبكة تجميع متعددة الآراء لتقسيم الصور الثنائية

Qian Yu† Xiaoqi Zhao† Youwei Pang† Lihe Zhang* Huchuan Lu

الملخص

التمييز الثنائي للفصل في الصور (Dichotomous Image Segmentation - DIS) بدأ مؤخرًا في الظهور لتحقيق فصل كائنات عالي الدقة من صور طبيعية ذات دقة عالية. عند تصميم نموذج DIS فعال، تحدي الرئيسي هو كيفية توازن التشتت الدلالي لأهداف ذات دقة عالية في المجال الاستقبالي الصغير والخسارة في التفاصيل ذات الدقة العالية في المجال الاستقبالي الكبير. تعتمد الأساليب الحالية على مسارات ومراحل متعددة ومتشعبة للترميز والفك لتكميل التحديد العالمي والتكرار المحلي تدريجيًا.نظام الرؤية البشري يلتقط المناطق ذات الاهتمام من خلال مراقبتها من زوايا متعددة. مستوحىً من هذا النظام، نقوم بنمذجة DIS كمشكلة إدراك كائنات متعددة الزوايا ونقدم شبكة تجميع متعددة الزوايا (Multi-View Aggregation Network - MVANet)، والتي توحد دمج الميزات بين المنظر البعيد والمنظر القريب في مسار واحد بهيكلية واحدة للترميز والفك. بمساعدة الوحدات المقترحة للتكميم المتعدد للزوايا والتكرار، أقام نهجنا تفاعلات بصرية طويلة المدى ومعمقة عبر زوايا متعددة، مما سمح لميزات المنظر القريب بالتركيز على الهياكل الرقيقة للغاية.أظهرت التجارب على مجموعة البيانات الشهيرة DIS-5K أن شبكتنا MVANet تتفوق بشكل كبير على أفضل الأساليب الحالية من حيث الدقة والسرعة. سيتم توفير الكود المصدر ومجموعات البيانات بشكل عام على الرابط \href{https://github.com/qianyu-dlut/MVANet}{MVANet}.


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp