المراجع الثنائية لتقسيم الصور ثنائية القيمة بدرجة دقة عالية

نقدم إطارًا مرجعيًا ثنائيًا جديدًا (BiRefNet) لتقسيم الصور الثنائية بدقة عالية (DIS). يتكون هذا الإطار من مكونين أساسيين: وحدة التحديد (LM) ووحدة إعادة البناء (RM) مع المرجع الثنائي المقترح من قبلنا (BiRef). تساعد الوحدة الأولى في تحديد الأشياء باستخدام المعلومات الدلالية الشاملة. داخل وحدة إعادة البناء، نستخدم المرجع الثنائي لعملية إعادة البناء، حيث توفر الرقع التسلسلية للصور المصدر المرجعي، بينما تخدم خرائط التدرج كمرجع الهدف. يعمل هذان المكونان معًا لإنتاج الخرائط المتوقعة النهائية. كما نقدم إشرافًا تكميليًا على التدرجات لتعزيز التركيز على المناطق ذات التفاصيل الدقيقة. بالإضافة إلى ذلك، نوضح استراتيجيات تدريب عملية عملية وموجهة لـ DIS لتحسين جودة الخرائط والعملية التدريبية. لتأكيد قابلية التطبيق العامة لم APPROACHنا، أجرينا تجارب واسعة النطاق على أربع مهام لتوضيح أن BiRefNet يظهر أداءً ملحوظًا، ويتفوق على أفضل الأساليب المخصصة للمهام في جميع المعايير. يمكن الوصول إلى رموز البرمجيات الخاصة بنا عبر الرابط https://github.com/ZhengPeng7/BiRefNet.