BFANet: إعادة النظر في التجزئة(semantic) ثلاثية الأبعاد باستخدام تحليل الميزات الحدودية

تُعد التجزئة الدلالية ثلاثية الأبعاد (3D Semantic Segmentation) دورًا أساسيًا وحاسمًا لفهم المشاهد ثلاثية الأبعاد. وعلى الرغم من أن التقنيات الحديثة المتطورة تركز بشكل رئيسي على تحسين الأداء العام للتجزئة الدلالية ثلاثية الأبعاد باستخدام مقاييس عامة (مثل mIoU، mAcc، وoAcc)، إلا أنها تهمل في الوقت نفسه إلى حد كبير استكشاف المناطق الصعبة في التجزئة. في هذا البحث، نعيد النظر في التجزئة الدلالية ثلاثية الأبعاد من منظور أكثر تفصيلًا، ونسلط الضوء على التعقيدات الدقيقة التي تُخفيها عادةً المقاييس الأداء الشاملة. بشكل محدد، قمنا بتحديد أخطاء التجزئة الدلالية ثلاثية الأبعاد إلى أربع فئات شاملة، بالإضافة إلى مقاييس تقييم مخصصة لكل فئة. وباستناد إلى هذا الإطار الفئوي، نقدم شبكة جديدة للتجزئة الدلالية ثلاثية الأبعاد تُسمى BFANet، والتي تدمج تحليلًا دقيقًا لسمات الحدود الدلالية. أولاً، صممنا وحدة الحدود-الدلالية (boundary-semantic module) لفصل ميزات السحابة النقطية إلى ميزات دلالية وحدود، ثم دمجنا طابور الاستفسارات الخاصة بهما لتعزيز الميزات الدلالية باستخدام الانتباه. ثانيًا، قدمنا خوارزمية أكثر اختصارًا وسرعة في حساب التسميات الوهمية للحدود، وهي أسرع بـ 3.9 مرة من الحالة المتطورة الحالية، مع توافقها مع تقنيات تضخيم البيانات، مما يتيح حسابًا فعّالًا أثناء التدريب. أظهرت التجارب الواسعة على مجموعات بيانات معيارية تفوق نموذج BFANet، مما يؤكد أهمية التركيز على المقاييس الأربعة المصممة خصيصًا. يمكن الوصول إلى الكود عبر الرابط: https://github.com/weiguangzhao/BFANet.