Vision Language Navigation
التنقل اللغوي البصري (VLN) هو مهمة تمكن الوكلاء الماديين من تنفيذ تعليمات اللغة الطبيعية في بيئات ثلاثية الأبعاد حقيقية. هدف هذه المهمة هو تحقيق فهم الوكيل وتنقله المستقل في بيئات معقدة من خلال دمج المعلومات البصرية واللغوية، مما يحمل قيمة تطبيقية كبيرة في مجالات مثل الروبوتات الذكية والمساعدين الافتراضيين.