HyperAIHyperAI
منذ 2 أشهر

شبكة إكمال المشهد الدلالية الفعالة باستخدام التجميع المكاني للدوال الإدراكية

Jiahui Zhang; Hao Zhao; Anbang Yao; Yurong Chen; Li Zhang; Hongen Liao
شبكة إكمال المشهد الدلالية الفعالة باستخدام التجميع المكاني للدوال الإدراكية
الملخص

نقدم تقنية التجميع المكاني (SGC) لتسريع حساب مهام التنبؤ الكثيف ثلاثي الأبعاد. تعمل SGC بشكل متعامد مع التجميع التقليدي، حيث تركز على الأبعاد المكانية بدلاً من البعد القناة الميزات. تقوم بتقسيم الفوكسلات الدخيلة إلى مجموعات مختلفة، ثم تنفذ عملية التجميع النادر ثلاثي الأبعاد على هذه المجموعات المنفصلة. نظرًا لأن فقط الفوكسلات الصالحة تُؤخذ بعين الاعتبار عند إجراء العملية التجميعية، يمكن تقليل الحساب بشكل كبير مع خسارة طفيفة في الدقة. تم التحقق من العمليات المقترحة في مهمة استكمال المشهد الدلالي، والتي تهدف إلى تنبؤ حجم ثلاثي أبعاد كامل مع علامات دلالية من صورة عمق واحدة. باستخدام SGC، نقدم أيضًا شبكة تجميعية نادرة ثلاثية الأبعاد فعالة، والتي تستفيد من هندسة متعددة المقاييس واستراتيجية التنبؤ من الخشن إلى الدقيق. تم إجراء التقييمات على مجموعة بيانات SUNCG، مما حقق أداءً رائدًا وسرعة عالية. الرمز البرمجي متاح على https://github.com/zjhthu/SGC-Release.git

شبكة إكمال المشهد الدلالية الفعالة باستخدام التجميع المكاني للدوال الإدراكية | أحدث الأوراق البحثية | HyperAI