شبكات النقاط الكاملة للسحابات النقاطية الكبيرة

يقترح هذا العمل معمارية شبكة عصبية متعددة الأغراض وشاملة للتحويلات (Fully-Convolutional Network) لمعالجة البيانات ثلاثية الأبعاد على نطاق كبير بكفاءة عالية. من الخصائص البارزة في نهجنا هو قدرته على معالجة التمثيلات ثلاثية الأبعاد غير المنظمة مثل السحب النقطية كمدخلات، ثم تحويلها داخليًا إلى هياكل مرتبة لتتم معالجتها عبر التحويلات الثلاثية الأبعاد. بخلاف النهج التقليدية التي تحتفظ إما بالتمثيلات غير المنظمة أو المنظمة من المدخل إلى المخرج، فإن نهجنا يتميز بقدرته على العمل على تمثيلات بيانات المدخلات الكفوءة من حيث الذاكرة، وفي الوقت نفسه استغلال البنية الطبيعية للعمليات التحويلية لتجنب الحساب والتخزين الزائد للمعلومات المكانية في الشبكة. تُلغي الشبكة الحاجة إلى معالجة البيانات الأولية coming from الحساسات قبل أو بعد المعالجة. هذا، بالإضافة إلى طبيعة الشبكة الشاملة للتحويلات، يجعل منها طريقة شاملة قادرة على معالجة سحب نقاط لمساحات ضخمة أو حتى غرف بأكملها تحتوي على ما يصل إلى 200 ألف نقطة دفعة واحدة. ميزة أخرى هي أن شبكتنا يمكنها إنتاج مخرج مرتب أو رسم التوقعات مباشرة على السحابة النقطية المدخلة، مما يجعلها مناسبة كوصف عام للسحابة النقطية قابل للتطبيق في العديد من المهام ثلاثية الأبعاد. نثبت قدرة شبكتنا على تعلم الخصائص الأولية بشكل فعال وكذلك العلاقات التركيبية المعقدة من خلال تقييمها على مجموعات بيانات معيارية لتقسيم البكسل الدلالي (Semantic Voxel Segmentation)، تقسيم الأجزاء الدلالية (Semantic Part Segmentation) ووصف المشاهد ثلاثية الأبعاد (3D Scene Captioning).