التمثيل العميق للتقسيم الدلالي ثلاثي الأبعاد

تعد تقسيم الدلالات للسحابات النقطية ثلاثية الأبعاد مشكلة صعبة ذات تطبيقات عديدة في العالم الحقيقي. بينما أحدث التعلم العميق ثورة في مجال تقسيم الدلالات للصور، فإن تأثيره على بيانات السحابة النقطية كان محدودًا حتى الآن. حاولت الدراسات الحديثة استخدام نماذج التعلم العميق ثلاثية الأبعاد (3D-CNNs) وحققت نتائج أقل من المتوقع. تتطلب مثل هذه الطرق تحويل البيانات النقطية إلى شكل فوكسلات، مما يؤدي إلى انخفاض دقة المكان وتزايد استهلاك الذاكرة. بالإضافة إلى ذلك، تعاني شبكات 3D-CNN بشدة من قلة توفر المجموعات المعطاة التسميات.في هذا البحث، نقترح إطار عمل بديل يتجنب حدود شبكات 3D-CNN. بدلاً من حل المشكلة مباشرة في ثلاثة أبعاد، نقوم أولًا بتحويل السحابة النقطية إلى مجموعة من الصور ثنائية الأبعاد المصنعة. ثم يتم استخدام هذه الصور كمدخل لشبكة 2D-CNN المصممة لتقسيم الدلالات. وأخيرًا، يتم إعادة تصوير النقاط التنبؤية المستخرجة من الشبكة إلى السحابة النقطية للحصول على نتائج التقسيم. كما ندرس تأثير أنواع متعددة من البيانات مثل اللون والعمق والNormals السطحية (المسطّحات الطبيعية) في هندسة شبكة متعددة المسارات. تم إجراء التجارب على مجموعة بيانات Semantic3D الحديثة. حققت طريقتنا مستوى جديدًا للمعايير الرائدة بتحقيق زيادة نسبتها 7.9% مقارنة بالطريقة الأفضل سابقًا.请注意,"surface normals" 在阿拉伯语中通常翻译为 "المسطّحات الطبيعية" 或 "المتجهات الطبيعية"،根据上下文和具体应用领域选择合适的翻译。在这里我选择了 "المسطّحات الطبيعية"。如果需要进一步的专业调整,请告知。