HyperAIHyperAI

Command Palette

Search for a command to run...

Sparse R-CNN: الكشف عن الكائنات من الطرف إلى الطرف باستخدام اقتراحات قابلة للتعلم

الملخص

نقدم "Sparse R-CNN"، وهي طريقة صريحة ونادرة للكشف عن الكائنات في الصور. تعتمد الدراسات الحالية في الكشف عن الكائنات بشكل كبير على مرشحات كائنات كثيفة، مثل مربعات المرشحات kkk المحددة مسبقًا على جميع الشبكات في خريطة سمات الصورة ذات الأبعاد H×WH\times WH×W. أما في طريقتنا، فنقدم مجموعة ثابتة من مقترحات الكائنات المُدرَّبة، بطول إجمالي يبلغ NNN، إلى وحدة التعرف على الكائنات لتنفيذ التصنيف والموقع. وباستبدال عدد كبير من المرشحات اليدوية البالغ HWkHWkHWk (ويمكن أن يصل إلى مئات الآلاف) بـ NNN (مثلاً 100) مقترحات قابلة للتدريب، تتجنب Sparse R-CNN تمامًا أي جهد مرتبط بتصميم مرشحات الكائنات، وكذلك تجنب عملية تعيين التسميات متعددة إلى واحدة. والأهم من ذلك، فإن التنبؤات النهائية تُنتج مباشرة دون الحاجة إلى عملية ما بعدية لاستبعاد التداخل الأقصى (non-maximum suppression). تُظهر Sparse R-CNN أداءً دقيقًا، وسرعة تشغيل، وسرعة تقارب في التدريب مماثلة للنماذج الأساسية المثبتة جيدًا على مجموعة بيانات COCO الصعبة، حيث حققت 45.0 نقطة AP في جدول تدريب قياسي بثلاث مرات (3×)، وتعمل بسرعة 22 إطارًا في الثانية باستخدام نموذج ResNet-50 FPN. نأمل أن يُحفّز عملنا على إعادة التفكير في الممارسة التقليدية للمرشحات الكثيفة في نماذج الكشف عن الكائنات. يُمكن الوصول إلى الشفرة المصدرية من خلال: https://github.com/PeizeSun/SparseR-CNN.


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp