Objectron: مجموعة بيانات كبيرة الحجم لفيديوهات تتمحور حول الكائنات في البيئة الطبيعية مع معلومات عن الوضعية

أصبح الكشف عن الكائنات ثلاثية الأبعاد شائعًا مؤخرًا بفضل تطبيقاته العديدة في الروبوتات، والواقع المعزز، والذكاء الاصطناعي المستقل، واسترجاع الصور. نقدّم مجموعة بيانات Objectron لتعزيز الحد الأدنى من التقدم في مجال الكشف عن الكائنات ثلاثية الأبعاد وتشجيع الأبحاث والتطبيقات الجديدة، مثل تتبع الكائنات ثلاثية الأبعاد، وتركيب الصور من زوايا مختلفة، وتمثيل أشكال ثلاثية الأبعاد محسّنة. تحتوي المجموعة على مقاطع فيديو قصيرة مركّزة حول الكائنات، مع تسميات وضع (Pose Annotations) لتسعة فئات، وتشمل 4 ملايين صورة مُعلّمة في 14,819 مقطعًا مُعلّمًا. كما نقترح معيار تقييم جديد يُسمى "الاتحاد على التقاطع ثلاثي الأبعاد" (3D Intersection over Union) للكشف عن الكائنات ثلاثية الأبعاد. ونُظهر فائدة مجموعتنا من خلال تقديم نماذج أساسية تم تدريبها على هذه المجموعة. تتوفر مجموعتنا من البيانات ورمز التقييم مفتوحًا للجمهور عبر الإنترنت على الرابط: http://www.objectron.dev