HyperAIHyperAI
منذ 18 أيام

ViewNet: هي هيكل أساسي جديد قائم على التصوير مع تجميع الرؤى للتصنيف القائم على عدد قليل من السحابات النقطية

{Senem Velipasalar, Minmin Yang, Jiajing Chen}
ViewNet: هي هيكل أساسي جديد قائم على التصوير مع تجميع الرؤى للتصنيف القائم على عدد قليل من السحابات النقطية
الملخص

رغم الطرق المختلفة التي تم اقتراحها لمهام متعلقة بسحابات النقاط ثلاثية الأبعاد، ما يزال التعلم من عدد قليل من الأمثلة (FSL) في سحابات النقاط ثلاثية الأبعاد موضوعًا غير مكتمل الاستكشاف. في التعلم من عدد قليل من الأمثلة، على عكس التعلم المراقب التقليدي، لا يوجد تداخل بين الفئات الموجودة في بيانات التدريب والاختبار، ويجب على النموذج التعرف على فئات غير مرئية بناءً على عدد قليل جدًا من الأمثلة. تعتمد الطرق الحالية لـ FSL في سحابات النقاط ثلاثية الأبعاد على نماذج تعتمد على النقاط كهيكل أساسي (backbone). ومع ذلك، بناءً على تجاربنا الواسعة وتحليلاتنا، نُظهر لأول مرة أن استخدام هيكل أساسي مبني على النقاط ليس هو الأفضل لتطبيقات FSL، وذلك لسببين: (أ) يتم التخلص من عدد كبير من خصائص النقاط بسبب عملية التجميع الأقصى (max pooling) المستخدمة في الهياكل الأساسية القائمة على النقاط ثلاثية الأبعاد، مما يقلل من قدرة التمثيل للمعلومات الشكلية؛ (ب) تكون الهياكل الأساسية القائمة على النقاط حساسة جدًا للإغلاق (occlusion). لمعالجة هذه المشكلات، نقترح استخدام هيكل أساسي مبني على التصوير (projection) وشبكات عصبية تلافيفية ثنائية الأبعاد (2D Convolutional Neural Network)، والذي نسميه ViewNet، لتطبيق FSL على سحابات النقاط ثلاثية الأبعاد. تتمثل خطوتنا الأولى في إسقاط سحابة النقاط ثلاثية الأبعاد على ستة أوضاع مختلفة لتخفيف مشكلة فقدان النقاط. كما نقترح تقنية "View Pooling" لتحسين تمثيل الخصائص، حيث تُجمَع توليفات مختلفة من المقاطع المُسقَطة في خمس مجموعات، ثم تُطبَّق عملية التجميع الأقصى على كل مجموعة على حدة. أظهرت التجارب التي أجريت على مجموعات بيانات ModelNet40 وScanObjectNN وModelNet40-C، باستخدام التحقق المتقاطع (cross validation)، أن طريقة العمل لدينا تتفوق باستمرار على أحدث النماذج القائمة (state-of-the-art baselines). علاوة على ذلك، مقارنةً بالهياكل الأساسية التقليدية المستخدمة في تصنيف الصور مثل ResNet، يمكن لـ ViewNet استخلاص خصائص أكثر تمييزًا من عدة أوضاع لسحابة نقطة واحدة. كما أظهرنا أن ViewNet يمكن استخدامه كهيكل أساسي مع مختلف أنواع رؤوس التعلم من عدد قليل من الأمثلة (FSL heads)، ويوفر أداءً أفضل مقارنةً بالهياكل الأساسية المستخدمة تقليديًا.