التعرف على الكيانات الاسمية متعددة الأوضاع
التعرف على الكيانات متعددة الوسائط (MNER) هو فرع مهم من معالجة اللغة الطبيعية، يهدف إلى تعزيز دقة ومتانة نماذج التعرف على الكيانات من خلال دمج معلومات الصور. يعتمد هذا المهم على تكامل البيانات البصرية والنصية لتحسين عملية التعرف على الكيانات، مما يزيد من القدرة على تحديد الكيانات في السيناريوهات المعقدة. له تطبيقات واسعة النطاق، مثل معالجة المستندات الذكية، وشرح الصور، واسترجاع المعلومات عبر الوسائط المتعددة.