HyperAIHyperAI
منذ 3 أشهر

مُحَوِّل تَعْدِيل الطلب للفصل الثلاثي الأبعاد للInstances

{Tianzhu Zhang, Jianfeng He, Chuxin Wang, Jiacheng Deng, Jiahao Lu}
مُحَوِّل تَعْدِيل الطلب للفصل الثلاثي الأبعاد للInstances
الملخص

يهدف التجزئة الثلاثية الأبعاد للInstances إلى التنبؤ بمجموعة من كيانات الكائنات في مشهد معين وتمثيلها كأقنعة أمامية ثنائية (Binary Foreground Masks) مُرفقة بعلامات دلالية مُقابلة. ومع ذلك، فإن كيانات الكائنات تختلف في الشكل والفئة، كما أن السحابات النقطية عادة ما تكون نادرة، وغير مرتبة، وغير منتظمة، مما يؤدي إلى مشكلة في عينة الاستعلام (Query Sampling Dilemma). علاوة على ذلك، تؤدي استعلامات الخلفية الضوضائية إلى إرباك في فهم المشهد بشكل صحيح وتؤثر سلبًا على دقة التجزئة الثلاثية الأبعاد للInstances. ولحل هذه المشكلات، نقترح نموذجًا يُدعى QueryRefinement Transformer، ويُعرف بـ QueryFormer. تكمن الفكرة الأساسية في منهجيتنا في استغلال وحدة تهيئة الاستعلام (Query Initialization Module) لتحسين عملية تهيئة توزيع الاستعلامات، بحيث تحقق تغطية عالية ونسبة تكرار منخفضة. بالإضافة إلى ذلك، قمنا بتصميم مُفكّك محوري (Affiliated Transformer Decoder) يُقلل من تأثير استعلامات الخلفية الضوضائية، ويساعد الاستعلامات الأمامية على التركيز على الأجزاء التمييزية لكل كائن، مما يُسهم في تحقيق نتائج نهائية دقيقة في التجزئة. أظهرت التجارب الواسعة على مجموعتي بيانات ScanNetV2 وS3DIS أن نموذج QueryFormer يمكنه تفوق الطرق المتطورة حديثًا في التجزئة الثلاثية الأبعاد للInstances.