HyperAIHyperAI
منذ 11 أيام

الموضعية القائمة على ليدار باستخدام الترميز الشامل والانحدار المعتمد على الذاكرة

{Shangshu Yu}
الملخص

تُعدّ التحديد البصري أمرًا بالغ الأهمية لتطبيقات عديدة في الروبوتات ورؤية الحاسوب. يُحقّق الاسترجاع المطلق للوضع (Absolute pose regression) التحديد من خلال ترميز خصائص المشهد ثم استرجاع الوضع، وقد حقق نتائج مبهرة في مجال التحديد. إذ يُسترجع الوضع بدرجة حرية 6 (6-DoF) من بيانات المشهد المُلتقطة وحدها. ومع ذلك، تعاني الطرق الحالية من الحاجة إلى إعادة تدريبها باستخدام بيانات مصدر محددة كلما تغير المشهد، ما يؤدي إلى تكاليف حسابية مرتفعة، وتسريب خصوصية البيانات، وتحديد غير موثوق بسبب عدم القدرة على تذكّر جميع البيانات. في هذا البحث، نقترح شبكة جديدة قائمة على ليدار لاسترجاع الوضع المطلق مع ترميز عام، بهدف تجنّب إعادة التدريب الزائد وفقدان خصوصية البيانات. وبشكل خاص، نقترح استخدام ترميز ميزات عام لمشاهد مختلفة. إذ يكفي إعادة تدريب المُعدّل (regressor) فقط لتحقيق كفاءة أعلى، ويتم التدريب باستخدام الميزات المُرمَّزة دون الحاجة إلى بيانات المصدر، مما يحافظ على خصوصية البيانات. ثم نقترح مُعدّلًا ذا ذاكرة (memory regressor) لتمكين الاسترجاع المُدرك للذاكرة، حيث تُحدّد عدد الوحدات الخفية في المُعدّل قدرة التذكّر. ويمكن استخدامه لاستخلاص الحد الأقصى لسعة التذكّر وتحسينها، مما يُمكّن من تحقيق تحديد أكثر موثوقية. كما يُمكن تعديل بنية المُعدّل لتناسب متطلبات مختلفة من سعة التذكّر حسب حجم المشهد. وقد أكدت تجارب واسعة على مجموعات بيانات خارجية وداخلية التحليلات المذكورة أعلاه وأثبتت فعالية الطريقة المقترحة.

الموضعية القائمة على ليدار باستخدام الترميز الشامل والانحدار المعتمد على الذاكرة | أحدث الأوراق البحثية | HyperAI