HyperAIHyperAI
منذ 2 أشهر

أنت تنظر مرة واحدة: الكشف عن الأشياء في الوقت الفعلي بشكل موحد

Joseph Redmon; Santosh Divvala; Ross Girshick; Ali Farhadi
أنت تنظر مرة واحدة: الكشف عن الأشياء في الوقت الفعلي بشكل موحد
الملخص

نقدم YOLO، وهي طريقة جديدة للكشف عن الأشياء. في الأعمال السابقة حول الكشف عن الأشياء، تم إعادة استخدام المصنفات لأداء الكشف. بدلاً من ذلك، نعتبر الكشف عن الأشياء مشكلة تربيعية (regression) للصناديق الحدودية المنفصلة فضائياً واحتمالات الفئات المرتبطة بها. يتنبأ شبكة عصبية واحدة مباشرة بالصناديق الحدودية واحتمالات الفئات من الصور الكاملة في تقييم واحد. نظرًا لأن مسار الكشف بأكمله هو شبكة واحدة، يمكن تحسينها بشكل مباشر من البداية إلى النهاية على أساس أداء الكشف.هندستنا الموحدة سريعة للغاية. يعالج نموذج YOLO الأساسي الصور في الوقت الحقيقي بمعدل 45 إطارًا في الثانية. هناك إصدار أصغر من الشبكة يُعرف بـ Fast YOLO، يعالج معدلًا مذهلًا يصل إلى 155 إطارًا في الثانية مع تحقيق ضعف دقة الاستدعاء المتوسط (mAP) للمكتشفات الأخرى التي تعمل في الوقت الحقيقي. عند مقارنتها بأنظمة الكشف الرائدة، فإن YOLO ترتكب المزيد من أخطاء التحديد المكاني ولكنها أقل احتمالاً بكثير للتنبؤ باكتشافات خاطئة حيث لا يوجد شيء. وأخيراً، تتعلم YOLO تمثيلات عامة جداً للأجسام. عندما يتم التعميم من الصور الطبيعية إلى الأعمال الفنية في كلٍ من مجموعة بيانات بيكاسو ومجموعة بيانات الناس-الفن، فإنها تتفوق على جميع طرق الكشف الأخرى بما فيها DPM و R-CNN بهامش كبير جدًا.

أنت تنظر مرة واحدة: الكشف عن الأشياء في الوقت الفعلي بشكل موحد | أحدث الأوراق البحثية | HyperAI