WaterScenes: مجموعة بيانات متعددة المهام لدمج الرادار ثلاثي الأبعاد والكاميرا ومقاييس أداء للقيادة الذاتية على الأسطح المائية

يلعب القيادة الذاتية على الأسطح المائية دورًا أساسيًا في تنفيذ المهام الخطرة والمتعبة زمنيًا، مثل المراقبة البحرية، وإنقاذ الناجين، والرصد البيئي، ورسم الخرائط الهيدروغرافية، وتنظيف النفايات. تقدم هذه الدراسة مجموعة بيانات WaterScenes، وهي أول مجموعة بيانات متعددة المهام وذات أبعاد أربعة (4D) تدمج بين رادار وكاميرا لدعم القيادة الذاتية على الأسطح المائية. مزودة برادار رباعي الأبعاد (4D) وكمّيرة منفردة (Monocular Camera)، يوفر مركبة سطحية غير مأهولة (USV) حلولًا قادرة على العمل في جميع الظروف الجوية، لاستخلاص معلومات مرتبطة بالكائنات، تشمل اللون، والشكل، والملمس، والمسافة، والسرعة، والاتجاه الأفقي، والاتجاه الرأسي. مع التركيز على الكائنات الثابتة والديناميكية الشائعة على الأسطح المائية، قمنا بوضع تسميات دقيقّة على صور الكاميرا على مستوى البكسل، وعلى سحابات النقاط الرادارية على مستوى النقطة. إلى جانب المهام الأساسية في التعرف البصري مثل كشف الكائنات، والتقسيم التماثلي (Instance Segmentation)، والتقسيم الدلالي (Semantic Segmentation)، نقدّم أيضًا تسميات لمهام التقسيم المكاني الحر (Free-space Segmentation) وتقسيم خط الماء (Waterline Segmentation). باستخدام البيانات متعددة المهام ومتعددة الوسائط، أجرينا تجارب معيارية على الوسائط الفردية (الرادار والكاميرا) وكذلك على الوسائط المدمجة. أظهرت النتائج التجريبية أن دمج الرادار رباعي الأبعاد مع الكاميرا يمكن أن يُحسّن بشكل كبير دقة وكفاءة التعرف على الأسطح المائية، وبخاصة في الظروف الضوئية والجوية السيئة. تُعدّ مجموعة بيانات WaterScenes متاحة للجمهور عبر الرابط: https://waterscenes.github.io.