Command Palette
Search for a command to run...
الترابط البصري ثلاثي الأبعاد
3D Visual Grounding هي تقنية رئيسية في مجال الرؤية الحاسوبية، تهدف إلى تحديد موقع وتحديد الأهداف بدقة في بيئة ثلاثية الأبعاد من خلال وصفها باللغة الطبيعية. تجمع هذه التقنية بين فهم الصور ومعالجة اللغة الطبيعية، مما يمكّن من ربط النص بالأشياء المحددة داخل مشهد ثلاثي الأبعاد، ولها قيمة تطبيقية واسعة، مثل في الواقع المعزز، وتوجيه الروبوتات، والتفاعل الذكي.