HyperAIHyperAI
منذ 11 أيام

Sparse R-CNN: الكشف عن الكائنات من الطرف إلى الطرف باستخدام اقتراحات قابلة للتعلم

Peize Sun, Rufeng Zhang, Yi Jiang, Tao Kong, Chenfeng Xu, Wei Zhan, Masayoshi Tomizuka, Lei Li, Zehuan Yuan, Changhu Wang, Ping Luo
Sparse R-CNN: الكشف عن الكائنات من الطرف إلى الطرف باستخدام اقتراحات قابلة للتعلم
الملخص

نقدم "Sparse R-CNN"، وهي طريقة صريحة ونادرة للكشف عن الكائنات في الصور. تعتمد الدراسات الحالية في الكشف عن الكائنات بشكل كبير على مرشحات كائنات كثيفة، مثل مربعات المرشحات $k$ المحددة مسبقًا على جميع الشبكات في خريطة سمات الصورة ذات الأبعاد $H\times W$. أما في طريقتنا، فنقدم مجموعة ثابتة من مقترحات الكائنات المُدرَّبة، بطول إجمالي يبلغ $N$، إلى وحدة التعرف على الكائنات لتنفيذ التصنيف والموقع. وباستبدال عدد كبير من المرشحات اليدوية البالغ $HWk$ (ويمكن أن يصل إلى مئات الآلاف) بـ $N$ (مثلاً 100) مقترحات قابلة للتدريب، تتجنب Sparse R-CNN تمامًا أي جهد مرتبط بتصميم مرشحات الكائنات، وكذلك تجنب عملية تعيين التسميات متعددة إلى واحدة. والأهم من ذلك، فإن التنبؤات النهائية تُنتج مباشرة دون الحاجة إلى عملية ما بعدية لاستبعاد التداخل الأقصى (non-maximum suppression). تُظهر Sparse R-CNN أداءً دقيقًا، وسرعة تشغيل، وسرعة تقارب في التدريب مماثلة للنماذج الأساسية المثبتة جيدًا على مجموعة بيانات COCO الصعبة، حيث حققت 45.0 نقطة AP في جدول تدريب قياسي بثلاث مرات (3×)، وتعمل بسرعة 22 إطارًا في الثانية باستخدام نموذج ResNet-50 FPN. نأمل أن يُحفّز عملنا على إعادة التفكير في الممارسة التقليدية للمرشحات الكثيفة في نماذج الكشف عن الكائنات. يُمكن الوصول إلى الشفرة المصدرية من خلال: https://github.com/PeizeSun/SparseR-CNN.

Sparse R-CNN: الكشف عن الكائنات من الطرف إلى الطرف باستخدام اقتراحات قابلة للتعلم | أحدث الأوراق البحثية | HyperAI