Command Palette
Search for a command to run...
PETR: تحويل التضمين المكاني للكشف ثلاثي الأبعاد عن الأجسام متعددة المنظورات
PETR: تحويل التضمين المكاني للكشف ثلاثي الأبعاد عن الأجسام متعددة المنظورات
Yingfei Liu Tiancai Wang Xiangyu Zhang Jian Sun
الملخص
في هذه الورقة، نُطور تحويل ترميز الموضع (PETR) للكشف عن الأجسام ثلاثية الأبعاد متعددة المنظورات. يُشفر PETR معلومات الموضع للإحداثيات ثلاثية الأبعاد في السمات الصورية، مما يُنتج سمات واعية بالموضع ثلاثي الأبعاد. يمكن لاستعلام الكائنات استشعار هذه السمات الواعية بالموضع ثلاثي الأبعاد وإجراء الكشف عن الكائنات بشكل مباشر من النهاية إلى النهاية. حقق PETR أداءً متميزًا (50.4% NDS و44.1% mAP) على مجموعة بيانات nuScenes القياسية، واحتل المرتبة الأولى في المعيار. ويمكنه أن يُعد أساسًا بسيطًا ولكن قويًا للبحث المستقبلي. تتوفر الشفرة على الرابط: \url{https://github.com/megvii-research/PETR}.