HyperAIHyperAI
منذ 11 أيام

الشبكات الكشفية النادرة التوليدية للكشف عن الكائنات ثلاثية الأبعاد في لحظة واحدة

JunYoung Gwak, Christopher Choy, Silvio Savarese
الشبكات الكشفية النادرة التوليدية للكشف عن الكائنات ثلاثية الأبعاد في لحظة واحدة
الملخص

تم دراسة كشف الأجسام ثلاثية الأبعاد بشكل واسع نظرًا لتطبيقاتها الواعدة في مجالات متعددة مثل الروبوتات والواقع المعزز. ومع ذلك، فإن الطبيعة النادرة للبيانات ثلاثية الأبعاد تفرض تحديات فريدة على هذه المهمة. ومن أبرز هذه التحديات، أن السطح المرئي للسحابات النقطية ثلاثية الأبعاد لا يتطابق مع مركز الكائن، مما يُعقّد عملية تثبيت توقعات الصندوق المحيط. ولحل هذه المشكلة، نقترح شبكة كشف نادرة توليدية (GSDN)، وهي شبكة كشف أحادية المرحلة تعتمد بالكامل على التحويلات التلافيفية، وتُولّد بشكل فعّال الدعم المطلوب لاقتراحات الكائنات. وتمثّل المكوّن الرئيسي في نموذجنا مُفكّك التنسور النادر التوليدي، الذي يستخدم سلسلة من التحويلات العكسية (التحويلات العكسية للتفصيل) وطبقات الحذف (الاستبعاد) لتوسيع نطاق التنسور النادر مع التخلص من المراكز غير المرجّحة للكائنات، وذلك للحفاظ على الحد الأدنى من زمن التنفيذ وحجم الذاكرة المستهلكة. وبفضل هذه البنية، يمكن لـ GSDN معالجة مدخلات ضخمة بشكل غير مسبوق في عملية تغذية أمامية واحدة بالكامل، مما يُلغِي الحاجة إلى مرحلة ما بعد معالجة تقليدية تعتمد على خوارزميات تجميع النتائج من نوافذ متحركة، كما هو الحال في الطرق السابقة. وقد أثبتنا فعالية نهجنا على ثلاث مجموعات بيانات داخلية ثلاثية الأبعاد، بما في ذلك مجموعة بيانات إعادة بناء داخلية ثلاثية الأبعاد واسعة النطاق، حيث تفوقت طريقة我们的 على أفضل الطرق الحالية بنسبة تحسن نسبية قدرها 7.14%، مع سرعة تفوق الأفضل في الأداء السابق بـ 3.78 مرة.

الشبكات الكشفية النادرة التوليدية للكشف عن الكائنات ثلاثية الأبعاد في لحظة واحدة | أحدث الأوراق البحثية | HyperAI