BigDetection: معيار على نطاق واسع لتدريب مُسبق للكشف عن الكائنات بشكل مُحسّن

تم تقديم العديد من مجموعات البيانات والتحديات المفتوحة للكشف عن الكائنات في السنوات الأخيرة. ولبناء أنظمة كشف عن كائنات أكثر شمولاً وقوة، قمنا في هذه الورقة ببناء معيار جديد كبير يُسمى BigDetection. هدفنا هو الاستفادة ببساطة من بيانات التدريب من مجموعات البيانات الحالية (LVIS، OpenImages، وObject365) باستخدام مبادئ مصممة بعناية، وتهيئة مجموعة بيانات أكبر لتحسين عملية التدريب المسبق للكشف عن الكائنات. بشكل خاص، قمنا بإنشاء تصنيف جديد يوحّد فضاءات التسميات المختلفة والمتنوعة من المصادر المختلفة. تحتوي مجموعة بيانات BigDetection على 600 فئة كائن، وتشمل أكثر من 3.4 مليون صورة تدريبية تحتوي على 36 مليون مربع حدودي. وهي أكبر بكثير من المعايير السابقة من حيث عدة أبعاد، مما يوفر فرصًا وتحديات جديدة. أظهرت التجارب الواسعة صلاحيتها كمعيار جديد لتقييم أساليب الكشف عن الكائنات المختلفة، وفعاليتها كمجموعة بيانات للتدريب المسبق.