HyperAI

Vgsi

تعرّف وتحديد الهدف والمشهد البصري (VGSI) هو مهمة متقدمة في مجال الرؤية الحاسوبية تهدف إلى اختيار صورة منطقية ومتسقة مع نية الهدف من خلال تحليل الأهداف النصية وصور الأحداث المرشحة المتعددة. تتطلب هذه المهمة ليس فقط من النموذج أن يعترف بدقة بالأعمال المحددة في الصور، بل أيضًا أن يفهم النوايا وراء هذه الأعمال، مما يتيح له اتخاذ قرارات صحيحة في المشاهد المعقدة. يتمتع تعرّف وتحديد الهدف والمشهد البصري بقيمة تطبيقية كبيرة في المساعدين الذكيين، أنظمة التلقين، وتواصل الإنسان والحاسوب، مما يعزز قدرات اتخاذ القرار وتجربة المستخدم في هذه الأنظمة.