HyperAIHyperAI
منذ 11 أيام

RT-BENE: مجموعة بيانات ونُقُدٌ أولية لتقدير اللمحة الفورية في البيئات الطبيعية

{Yiannis Demiris, Kévin Cortacero, Tobias Fischer}
RT-BENE: مجموعة بيانات ونُقُدٌ أولية لتقدير اللمحة الفورية في البيئات الطبيعية
الملخص

في السنوات الأخيرة، حققت أساليب تقدير الاتجاه البصري تقدماً كبيراً، مدفوعة بتطبيقات متعددة تشمل التفاعل بين الإنسان والروبوت، وتقييم الانتباه البصري، والعرض المركّز للرؤية (foveated rendering) في نظارات الواقع الافتراضي. ومع ذلك، فإن العديد من أساليب تقدير الاتجاه البصري تفترض عادةً أن عيني الفرد مفتوحتان؛ أما في حالة الإغلاق، فإن هذه الأساليب تُقدّم تقديرات غير منتظمة للاتجاه البصري. ونُعالج هذه الافتراضية من خلال تقديم مجموعة بيانات مفتوحة المصدر جديدة، تحتوي على تسميات لحالة فتح العينين في أكثر من 200,000 صورة للعين، بما في ذلك أكثر من 10,000 صورة تُظهر العينين مغلقتين. كما نقدّم أساليب أساسية تسمح كشف الومضات (blinks) باستخدام الشبكات العصبية التلافيفية (convolutional neural networks). ونُظهر من خلال تجارب واسعة أن الأساليب المقترحة تحقق أداءً متميزاً من حيث الدقة (precision) والاحتواء (recall). كما نُدمج الأساليب الأساسية المُقترحة (RT-BENE) في إطار تقدير الاتجاه البصري الجديد (RT-GENE)، حيث توفر تقديرًا في الزمن الفعلي لحالة فتح العينين. ونُبرز أن عملنا سيُسهم في تطوير كلاً من أساليب تقدير الاتجاه البصري وتقدير الومضات، ونُقدّم خطوات نحو دمج هذين النوعين من الأساليب.

RT-BENE: مجموعة بيانات ونُقُدٌ أولية لتقدير اللمحة الفورية في البيئات الطبيعية | أحدث الأوراق البحثية | HyperAI