استغلال التحيز الاستقرائي في محولات ترانسفورمر لتصنيف وتقسيم السحابة النقطية

اكتشاف الاتصال بين النقاط لاستخراج الخصائص ذات الأبعاد العالية بكفاءة من إحداثيات النقطة هو تحدي رئيسي في معالجة السحابة النقطية. تركز معظم الطرق الحالية على تصميم مستخلصات الخصائص المحلية الكفؤة بينما تتجاهل الاتصال العالمي، أو العكس. في هذا البحث، نصمم طريقة جديدة تعتمد على التحويل المدعوم بالتحيز الاستدلالي (Inductive Bias-aided Transformer - IBT) لتعلم العلاقات ثلاثية الأبعاد بين النقاط، والتي تأخذ بعين الاعتبار كلًا من الانتباه المحلي والعالمي. بشكل خاص، مع الأخذ بعين الاعتبار التجانس الفضائي المحلي، يتم تنفيذ تعلم الخصائص المحلية من خلال الترميز الموضعي النسبي (Relative Position Encoding) وجمع الخصائص المعتمد على الانتباه (Attentive Feature Pooling). ندمج التجانس المحلي الذي تم تعلمه في وحدة التحويل. يؤثر الخصائص المحلية على مكون قيمة التحويل لتعديل العلاقة بين قنوات كل نقطة، مما يمكن من تعزيز آلية الذاتي-الانتباه (self-attention) بالتفاعل القناة المستند إلى التجانس المحلي. نثبت تفوقها تجريبيًا في مهام التصنيف والتقسيم. الرمز متاح على: https://github.com/jiamang/IBT