Unitail: الكشف عن القراءة والتطابق في مشهد البيع بالتجزئة

للاستفادة الكاملة من تقنية الرؤية الحاسوبية في المتاجر، يجب الأخذ بعين الاعتبار الاحتياجات الفعلية التي تناسب خصائص المشهد البيعي. لتحقيق هذا الهدف، نقدم مجموعة بيانات البيع بالتجزئة الموحدة (Unitail)، وهي معيار كبير لمهمات بصرية أساسية على المنتجات يتحدى الخوارزميات في الكشف والقراءة والمطابقة. تحتوي Unitail على 1.8 مليون حالة شكل رباعي تم تسميتها، مما يقدم مجموعة بيانات للكشف تساعد في مواءمة مظهر المنتج بشكل أفضل. بالإضافة إلى ذلك، توفر مجموعة بيانات تعتمد على التعرف الضوئي على الحروف (OCR) بنمط المعرض تحتوي على 1454 فئة منتج، و30 ألف منطقة نص، و21 ألف نسخة لتمكين القراءة القوية على المنتجات وتحفيز المطابقة المعززة للمنتجات. إلى جانب استخدام مختلف التقنيات الرائدة لقياس أداء هذه المجموعات البيانات، قمنا بتخصيص كاشف جديد للكشف عن المنتجات وتقديم حل مطابقة بسيط يعتمد على OCR يثبت فعاليته.