HyperAIHyperAI
منذ 2 أشهر

YOLO9000: أفضل، أسرع، أقوى

Joseph Redmon; Ali Farhadi
YOLO9000: أفضل، أسرع، أقوى
الملخص

نقدم نظام YOLO9000، وهو نظام متقدم للكشف عن الأشياء في الوقت الحقيقي قادر على الكشف عن أكثر من 9000 فئة من الأشياء. أولاً، نقترح عدة تحسينات على طريقة الكشف YOLO، سواء كانت جديدة أو مستوحاة من الأعمال السابقة. النموذج المحسن، YOLOv2، يعتبر من أفضل النماذج في مهام الكشف القياسية مثل PASCAL VOC و COCO. عند معدل إطارات يبلغ 67 إطارًا في الثانية (FPS)، يحقق YOLOv2 دقة متوسطة (mAP) تبلغ 76.8% على مجموعة اختبار PASCAL VOC لعام 2007. عند معدل إطارات يبلغ 40 إطارًا في الثانية (FPS)، يحقق YOLOv2 دقة متوسطة (mAP) تبلغ 78.6%, مما يجعله يتفوق على الأساليب المتقدمة الأخرى مثل Faster RCNN مع ResNet و SSD بينما لا يزال يعمل بشكل أسرع بكثير. أخيرًا، نقترح طريقة للتدريب المشترك على الكشف عن الأشياء والتصنيف. باستخدام هذه الطريقة، نقوم بتدريب YOLO9000 بشكل متزامن على مجموعة بيانات COCO للكشف عن الأشياء ومجموعة بيانات ImageNet للتصنيف. التدريب المشترك لدينا يسمح لـ YOLO9000 بالتنبؤ بالكشف عن فئات الأشياء التي ليس لديها بيانات كشف موسومة. نتحقق من صحة نهجنا في مهمة الكشف عن ImageNet. يحقق YOLO9000 دقة متوسطة (mAP) تبلغ 19.7% على مجموعة التحقق من صحة ImageNet للكشف عن الأشياء رغم وجود بيانات كشف فقط لـ 44 فئة من أصل 200 فئة. بالنسبة للفئات الـ 156 التي لا تتواجد في COCO، يحقق YOLO9000 دقة متوسطة (mAP) تبلغ 16.0%. ولكن YOLO يمكنه الكشف عن أكثر من مجرد 200 فئة؛ فهو يقوم بالتنبؤ بالكشف عن أكثر من 9,000 فئة مختلفة من الأشياء. وما زال يعمل في الوقت الحقيقي.注:在阿拉伯语中,百分比符号通常放在数字后面,因此 "76.8%" 被翻译为 "76.8٪"。另外,为了保持句子的流畅性和正式性,对一些句子进行了适当的结构调整。

YOLO9000: أفضل، أسرع، أقوى | أحدث الأوراق البحثية | HyperAI