HyperAIHyperAI

التمييز الدلالي المُحَفَّز بالصوت

التمييز الدلالي المُحفز بالصوت هو مهمة تجمع بين رؤية الحاسوب ومعالجة الإشارات الصوتية، وتهدف إلى التنبؤ بقناع التمييز الدلالي للأشياء المقابلة في الصورة بناءً على الإشارات الصوتية المعطاة. هذه المهمة تستفيد من المعلومات الصوتية لتعزيز الفهم البصري، مما يحسن دقة ومتانة التعرف على الأهداف، ولها قيمة تطبيقية كبيرة في مجالات مثل المراقبة الذكية، القيادة الذاتية، والتفاعل بين الإنسان والحاسوب.

التمييز الدلالي المُحَفَّز بالصوت | SOTA | HyperAI