LogoDet-3K: مجموعة بيانات صور كبيرة الحجم للكشف عن الشعارات

حظي كشف الشعارات باهتمام كبير نظرًا لتطبيقاتها الواسعة في مجال الوسائط المتعددة، مثل كشف انتهاكات حقوق الملكية، ورصد مدى ظهور العلامات التجارية، وإدارة علامات المنتجات على وسائل التواصل الاجتماعي. في هذا البحث، نقدّم مجموعة بيانات LogoDet-3K، أكبر مجموعة بيانات للكشف عن الشعارات مُعدّة بالكامل، وتشمل 3000 فئة من الشعارات، وحوالي 200,000 كائن شعار تم تحديدها يدويًا، و158,652 صورة. تُشكّل LogoDet-3K منصة تقييم أكثر تحديًا في مجال كشف الشعارات، نظرًا لتغطيتها الشاملة الأعلى وتنوعها الأكبر في فئات الشعارات والكائنات المُعلّمة مقارنةً بالمبادرات السابقة. نصفّر عملية جمع وتحديد البيانات في مجموعتنا، ونحلّل حجمها وتنوعها مقارنةً بغيرها من مجموعات البيانات المستخدمة في كشف الشعارات. كما نقترح طريقة أساسية قوية تُسمى Logo-Yolo، والتي تدمج خسارة Focal وخسارة CIoU داخل الإطار المتطور YOLOv3 للكشف عن الشعارات على نطاق واسع. تُحلّ Logo-Yolo مشكلات كائنات متعددة المقاييس، وعدم توازن العينات الخاصة بالشعارات، والانحراف في التقدير المربع المحيط (bounding-box regression). وتُحقق أداءً متوسطًا أفضل بنسبة حوالي 4% مقارنةً بـ YOLOv3، وتحسينات أكبر مقارنةً بعدة نماذج كشف عميقة مُعلنة على مجموعة بيانات LogoDet-3K. كما تُثبت التقييمات على ثلاث مجموعات بيانات أخرى موجودة فعالية طريقةنا، وتُظهر قدرة أفضل على التعميم في مهام كشف الشعارات واسترجاعها. تُستخدم مجموعة بيانات LogoDet-3K لتعزيز الأبحاث المتعلقة بالشعارات على نطاق واسع، ويمكن الاطلاع عليها عبر الرابط: https://github.com/Wangjing1551/LogoDet-3K-Dataset.