توليد التعبير المرجعي
توليد التعبيرات المرجعية هو مهمة أساسية في مجال الرؤية الحاسوبية، يهدف إلى إنشاء تعبيرات بلغة طبيعية قادرة على تحديد الأشياء المحددة داخل الصورة بشكل فريد. الهدف من هذه المهمة هو إنتاج وصف دقيق ومميز من خلال دمج المعلومات البصرية والمعرفة اللغوية، مما يسهل الإشارة إلى الأشياء في التفاعل بين الإنسان والحاسوب. قيمة تطبيق هذه التقنية واسعة، حيث تشمل سيناريوهات مثل الواقع المعزز، وشرح الصور، وتوجيه الروبوتات، مما يعزز التفاعل وتجربة المستخدم في الأنظمة.