ETH-XGaze: مجموعة بيانات كبيرة الحجم لتقدير الاتجاه البصري في ظل وضعيات رأس متطرفة وتغيرات في الاتجاه البصري

يُعد تقدير التوجه البصري مهمة أساسية في العديد من تطبيقات الرؤية الحاسوبية والتفاعل بين الإنسان والحاسوب والروبوتات. تُدرَّب العديد من الطرق المتطورة حديثًا وتُختبر على مجموعات بيانات مخصصة، مما يُعقّد عملية المقارنة بين الأساليب المختلفة. علاوةً على ذلك، تُعاني مجموعات بيانات تقدير التوجه البصري الحالية من تنوع محدود في مواقف الرأس والاتجاهات البصرية، كما تُجرى التقييمات باستخدام بروتوكولات ومقاييس مختلفة. في هذا البحث، نقترح مجموعة بيانات جديدة لتقدير التوجه البصري تُسمى ETH-XGaze، وتتألف من أكثر من مليون صورة عالية الدقة تمثل توجهاً بصرياً متنوعاً تحت مواقف رأس متطرفة. تم جمع هذه المجموعة من 110 مشاركين باستخدام نظام معدات مخصص يتضمن 18 كاميرا رقمية من نوع SLR، وظروف إضاءة قابلة للتعديل، وأنظمة مُدرَّبة بدقة لتسجيل أهداف التوجه البصري الحقيقية. ونُظهر أن مجموعتنا يمكنها تحسين قدرة طرق تقدير التوجه البصري على التحمل في مختلف مواقف الرأس والزوايا البصرية. بالإضافة إلى ذلك، نُعرّف بروتوكولًا تجريبيًا موحدًا ومقاييس تقييم على ETH-XGaze، بهدف توحيد أبحاث تقدير التوجه البصري في المستقبل. تتوفر مجموعة البيانات والموقع المُقيّم على الرابط: https://ait.ethz.ch/projects/2020/ETH-XGaze