Far3D: توسيع الأفق للكشف عن الكائنات ثلاثية الأبعاد من المنظور المحيطي

في الآونة الأخيرة، شهد الكشف عن الأجسام ثلاثية الأبعاد من صور الرؤية المحيطة تقدماً ملحوظاً بفضل تكاليف التنفيذ المنخفضة. ومع ذلك، ركزت معظم الدراسات بشكل رئيسي على مدى الرؤية القريبة، بينما ظلت الكشف عن المسافات الطويلة أقل استكشافاً. يواجه توسيع الطرق الحالية لتشمل مسافات طويلة تحديات مثل التكاليف الحسابية العالية وعدم استقرار التقارب. لمعالجة هذه القيود، نقترح في هذا البحث إطاراً جديداً قائماً على الاستعلامات النادرة، يُسمى Far3D. من خلال استخدام مُعطيات كشف كائنات ثنائية الأبعاد عالية الجودة، نُنشئ استعلامات ثلاثية الأبعاد مُعدّلة تكمل الاستعلامات ثلاثية الأبعاد الشاملة. ولالتقاط الميزات التمييزية بكفاءة عبر مختلف الزوايا والمقاييس للأجسام البعيدة، نقدّم وحدة تجميع مُدركة للمنظور. علاوةً على ذلك، نقترح نهجاً لتنقية ثلاثي الأبعاد يُعدّل حسب النطاق، لمعالجة انتشار أخطاء الاستعلام وتقليل مشاكل التقارب في المهام طويلة المدى. وبشكل ملحوظ، تُظهر Far3D أداءً منافساً للحالة الراهنة (SoTA) على مجموعة بيانات Argoverse 2 الصعبة، التي تمتد لمسافة واسعة تصل إلى 150 متراً، متفوقةً على عدة طرق تعتمد على LiDAR. وفي الوقت نفسه، تُظهر Far3D أداءً أفضل مقارنة بالطرق السابقة على مجموعة بيانات nuScenes. يُمكن الوصول إلى الكود عبر الرابط: https://github.com/megvii-research/Far3D.