Visual Dialogue
الحوار البصري هو مهمة متقدمة في مجال الرؤية الحاسوبية تتطلب من وكيل الذكاء الاصطناعي الانخراط في تواصل ذي معنى مع البشر حول محتوى الصور بطريقة محادثة طبيعية. هدف هذه المهمة هو إنشاء ردود دقيقة ومتصلة استنادًا إلى الصورة المعطاة، تاريخ المحادثة، والأسئلة التالية، مما يعزز مستوى الذكاء وتجربة المستخدم في التفاعل بين الإنسان والحاسوب. تكمن قيمته التطبيقية في تحسين قدرات الفهم البصري للمساعدين الافتراضيين، أنظمة خدمة العملاء الذكية، وغيرها من التطبيقات، مما يساهم في تعزيز طرق التفاعل الأغنى والأكثر حدسية.