HyperAIHyperAI
منذ 16 أيام

باندو: بناء مجموعة بيانات بصرية ضخمة بمستمر من خلال التآزر البشري-الآلي

Yuanhan Zhang, Qinghong Sun, Yichun Zhou, Zexin He, Zhenfei Yin, Kun Wang, Lu Sheng, Yu Qiao, Jing Shao, Ziwei Liu
باندو: بناء مجموعة بيانات بصرية ضخمة بمستمر من خلال التآزر البشري-الآلي
الملخص

تلعب المجموعات الكبيرة من البيانات دورًا حيويًا في الرؤية الحاسوبية. ولكن المجموعات الحالية تُANNOTATE بشكل أعمى دون تمييز بين العينات، مما يجعل جمع البيانات غير فعّال وغير قابل للتوسع. والسؤال المفتوح هو كيف يمكن بناء مجموعة بيانات ضخمة بشكل نشط. وعلى الرغم من أن خوارزميات التعلم النشط المتقدمة قد تكون الحل، إلا أننا وجدنا تجريبيًا أنها غير فعّالة في السياق العملي لتصنيف البيانات حيث تكون البيانات غير الموزونة توزيعيًا واسعة الانتشار. ولذلك، تُقدّم هذه الدراسة إطارًا جديدًا للتعلم النشط يناسب التصنيف العملي للبيانات. وباستخدام هذا الإطار، نُنشئ مجموعة بيانات بصرية عالية الجودة تُسمى "Bamboo"، تضم 69 مليون تسمية تصنيفية لصور مع 119 ألف فئة، و28 مليون تسمية لحدود كائنات (bounding boxes) مع 809 فئات. ونرتب هذه الفئات باستخدام تصنيف هرمي تم دمجه من عدة قواعد معرفية. وتبلغ تسميات التصنيف في Bamboo أربع مرات ما هو موجود في ImageNet22K، بينما تفوق تسميات الكشف فيها ثلاث مرات ما هو موجود في Object365. مقارنةً بـ ImageNet22K وObject365، تُظهر النماذج المُدرّبة مسبقًا على Bamboo أداءً متفوّقًا في مهام متعددة لاحقة (بزيادة قدرها 6.2% في التصنيف و2.1% في الكشف). نعتقد أن إطارنا للتعلم النشط وبيانات Bamboo يُعدان ضروريين للعمل المستقبلي في هذا المجال.

باندو: بناء مجموعة بيانات بصرية ضخمة بمستمر من خلال التآزر البشري-الآلي | أحدث الأوراق البحثية | HyperAI