HyperAIHyperAI
منذ 17 أيام

ObjectNet: مجموعة بيانات كبيرة الحجم مُحكَمة التحيز لدفع حدود نماذج تمييز الكائنات

{Josh Tenenbaum, Christopher Wang, David Mayo, Dan Gutfreund, William Luo, Julian Alverio, Boris Katz, Andrei Barbu}
ObjectNet: مجموعة بيانات كبيرة الحجم مُحكَمة التحيز لدفع حدود نماذج تمييز الكائنات
الملخص

نجمع مجموعة اختبار واقعية كبيرة، تُسمى ObjectNet، لتمييز الكائنات مع وجود ضوابط تضمن أن الخلفيات، والدورانات، ونقاط الرؤية البصرية للكائنات تكون عشوائية. تمتلك معظم التجارب العلمية ضوابط، وتُزيل العوامل المُربكة من البيانات، لضمان عدم قدرة الأفراد على أداء المهمة من خلال الاستفادة من العلاقات التافهة في البيانات. وعلى نحو تاريخي، كانت مجموعات البيانات الكبيرة المستخدمة في التعلم الآلي ورؤية الحاسوب تفتقر إلى هذه الضوابط. وقد أدى ذلك إلى ظهور نماذج تتطلب ضبطًا دقيقًا (fine-tuning) لكل مجموعة بيانات جديدة، وتُظهر أداءً أفضل في مجموعات البيانات مقارنة بالأداء الفعلي في التطبيقات الواقعية. عند اختبار نماذج كشف الكائنات على ObjectNet، تظهر انخفاضات في الأداء تتراوح بين 40% إلى 45% مقارنة بأدائها في المعايير الأخرى، وذلك بسبب وجود الضوابط التي تقلل من التحيزات. وتُظهر ObjectNet مقاومة عالية للضبط الدقيق، حيث لا تُسجّل سوى زيادة طفيفة في الأداء. نطور منصة آلية للغاية تتيح جمع مجموعات بيانات مصحوبة بضوابط من خلال التوظيف الجماعي لتصوير الصور وتصنيفها. تبلغ حجم ObjectNet نفس حجم مجموعة اختبار ImageNet (50,000 صورة)، وبتصميم مقصود لا تُزوَّد بمجموعة تدريب لتشجيع التعميم. تُعد هذه المجموعة أسهل من ImageNet (لأن الكائنات تكون في الغالب مركزية وغير مُحَجَّبة)، ولكنها أيضًا أصعب (بسبب الضوابط). وعلى الرغم من تركيزنا هنا على تمييز الكائنات، يمكن جمع بيانات مصحوبة بضوابط على نطاق واسع باستخدام أدوات آلية في جميع أنحاء مجال التعلم الآلي، بهدف إنشاء مجموعات بيانات تُجبر النماذج على التفاعل بطرق جديدة، مما يوفر ملاحظات قيمة للباحثين. يفتح هذا العمل آفاقًا جديدة للبحث في مجالات رؤية الحاسوب العامة والمتينة، والمتقاربة من الطريقة التي يرى بها الإنسان، بالإضافة إلى إنشاء مجموعات بيانات تكون نتائجها تنبؤية بأداء النماذج في البيئات الواقعية.