التدريب المسبق للسحابة النقطية باستخدام الهياكل الثلاثية الأبعاد الطبيعية

يتطلب بناء مجموعات بيانات سحابية ثلاثية الأبعاد (3D point cloud datasets) جهدًا بشريًا كبيرًا. وبالتالي، يُعد بناء مجموعة بيانات ضخمة للسحابات ثلاثية الأبعاد أمرًا صعبًا. لمعالجة هذه المشكلة، نقترح قاعدة بيانات جديدة للسحابات ثلاثية الأبعاد تُسمى "PC-FractalDB"، وهي عائلة مبتكرة من قواعد البيانات مُشَغَّلة بالصيغ، ومستوحاة من الهندسة الكسيرية (fractal geometry) التي تظهر في الهياكل ثلاثية الأبعاد الطبيعية، وتُعتمد على التعلم المُوجَّه المُشَغَّل بالصيغ. تعتمد بحثنا على الفرضية القائلة بإننا يمكننا تعلُّم تمثيلات أكثر واقعية من الأنماط ثلاثية الأبعاد في العالم الحقيقي مقارنةً بالقواعد التقليدية للسحابات ثلاثية الأبعاد، وذلك من خلال تعلُّم الهندسة الكسيرية. نُظهر كيف تسهم PC-FractalDB في حل عدة مشكلات حديثة مرتبطة بالقواعد البيانات في فهم المشاهد ثلاثية الأبعاد، مثل جمع النماذج ثلاثية الأبعاد وعملية التسمية المُتطلبة لجهد بشري كبير. تُظهر الدراسة التجريبية كيف تحققت معدلات أداء تصل إلى 61.9% و59.0% على مجموعتي بيانات ScanNetV2 وSUN RGB-D على التوالي، متفوقةً على أعلى الدرجات المُحقَّقة سابقًا باستخدام PointContrast، والسياقات المشهدية التقابلية (CSC)، ونماذج RandomRooms. كما أن نموذج PC-FractalDB المُدرَّب مسبقًا يُظهر كفاءة خاصة عند التدريب بكميات محدودة من البيانات. على سبيل المثال، عند استخدام 10% فقط من بيانات التدريب على ScanNetV2، حقق نموذج VoteNet المُدرَّب مسبقًا باستخدام PC-FractalDB أداءً بنسبة 38.3%، أي بزيادة قدرها 14.8% مقارنةً بـ CSC. ومن الجدير بالذكر بشكل خاص أننا وجدنا أن الطريقة المقترحة تحقق أعلى النتائج في مهام التدريب المسبق للكشف عن الأجسام ثلاثية الأبعاد عند توفر كميات محدودة من البيانات السحابية.