REGTR: تطابقات سحابة النقاط من الطرف إلى الطرف باستخدام المحولات

رغم النجاح الأخير في دمج التعلم في عملية مطابقة السحاب النقطي، يركز العديد من الأبحاث على تعلم وصفات الميزات، مع الاستمرار في الاعتماد على مطابقة الميزات القريبة جدًا (nearest-neighbor feature matching) وتصفية النقاط الشاذة من خلال خوارزمية RANSAC للحصول على مجموعة النهاية من المطابقات اللازمة لتقدير الوضع. في هذا العمل، نفترض أن آليات الانتباه (attention mechanisms) يمكن أن تحل محل دور المطابقة الصريحة للميزات وRANSAC، وبالتالي نقترح إطارًا متكاملًا (end-to-end) يتنبأ مباشرةً بالمجموعة النهائية من المطابقات. نستخدم بنية شبكة تتكون أساسًا من طبقات تحويل (transformer layers) التي تحتوي على انتباه ذاتي (self-attention) وانتباه متبادل (cross-attention)، وندرّبها لتتنبأ باحتمالية وقوع كل نقطة في المنطقة المتداخلة، وكذلك بموقعها المقابل في السحاب النقطي الآخر. يمكن بعد ذلك تقدير التحويل الثابت المطلوب مباشرة من المطابقات المتنبأ بها دون الحاجة إلى معالجة لاحقة. وعلى الرغم من بساطة النهج، يحقق أسلوبنا أداءً متقدمًا (state-of-the-art) على مجموعتي بيانات 3DMatch وModelNet. يمكن العثور على كود المصدر لدينا عبر الرابط: https://github.com/yewzijian/RegTR.