HyperAIHyperAI
منذ 17 أيام

أمثلة كاستفسارات

Yuxin Fang, Shusheng Yang, Xinggang Wang, Yu Li, Chen Fang, Ying Shan, Bin Feng, Wenyu Liu
أمثلة كاستفسارات
الملخص

في الآونة الأخيرة، تحققت أطر الكشف عن الكائنات القائمة على الاستفسارات أداءً مماثلاً لأفضل الأطر السابقة في الكشف عن الكائنات. ومع ذلك، لا يزال السؤال حول كيفية الاستفادة الكاملة من هذه الأطر في إجراء التجزئة الظاهرة (instance segmentation) مفتوحًا. في هذه الورقة، نقدم QueryInst (الكائنات كاستفسارات)، وهي طريقة قائمة على الاستفسارات للتقطيع الظاهرة، تعتمد على مراقبة متوازية على رؤوس قناع ديناميكية. الفكرة الأساسية لـ QueryInst هي الاستفادة من العلاقة الواحدة-إلى-واحدة المتأصلة في استفسارات الكائنات عبر المراحل المختلفة، وكذلك العلاقة الواحدة-إلى-واحدة بين ميزات مربعات الاهتمام (mask RoI) واستفسارات الكائنات في المرحلة نفسها. يُزيل هذا النهج الربط الصريح بين رؤوس القناع متعددة المراحل، ومشكلة عدم اتساق توزيع الاقتراحات التي تنشأ في الطرق غير القائمة على الاستفسارات للتقطيع الظاهرة متعدد المراحل. أجرينا تجارب واسعة على ثلاث معايير صعبة، وهي COCO وCityScapes وYouTube-VIS، لتقييم فعالية QueryInst في مهام التقطيع الظاهرة والتقطيع الظاهرة في الفيديو (VIS). وباستخدام هيكل أساسي من نوع ResNet-101-FPN، حقق QueryInst 48.1 نقطة AP للصناديق و42.8 نقطة AP للقناع على مجموعة COCO test-dev، وهي أداء أعلى بـ 2 نقاط من HTC من حيث كلا من AP للصناديق وAP للقناع، مع سرعة تشغيل تفوق بـ 2.4 مرة. وفي مهام التقطيع الظاهرة في الفيديو، حقق QueryInst أفضل أداء بين جميع الطرق القائمة على الاستفسارات المباشرة (online VIS)، مع تحقيق توازن جيد بين السرعة والدقة. يُمكن الوصول إلى الكود من خلال الرابط التالي: \url{https://github.com/hustvl/QueryInst}.