Video To Image Affordance Grounding
"فيديو إلى صورة تأريخ القدرة" هو جزء فرعي في مجال الرؤية الحاسوبية يهدف إلى تحليل مناطق التفاعل باليد في مقاطع الفيديو التوضيحية لإنشاء خرائط حرارية متناظرة للعمليات على الصور المستهدفة وتوثيق الأفعال التشغيلية المحددة (مثل الضغط، الدوران، إلخ). يمكن لهذا المهمة تحديد أجزاء الأشياء القابلة للتشغيل ووظائفها بدقة، مما يشكل قيمة تطبيقية كبيرة لعمليات التلاعب الروبوتية، التفاعل بين الإنسان والحاسوب، وتقنيات الواقع المعزز.