HyperAI

التمييز الدلالي المُحفز بالصوت هو مهمة تجمع بين رؤية الحاسوب ومعالجة الإشارات الصوتية، وتهدف إلى التنبؤ بقناع التمييز الدلالي للأشياء المقابلة في الصورة بناءً على الإشارات الصوتية المعطاة. هذه المهمة تستفيد من المعلومات الصوتية لتعزيز الفهم البصري، مما يحسن دقة ومتانة التعرف على الأهداف، ولها قيمة تطبيقية كبيرة في مجالات مثل المراقبة الذكية، القيادة الذاتية، والتفاعل بين الإنسان والحاسوب.

ADE20K

CAVMAE

HyperAI

ADE20K

CAVMAE

Command Palette

التمييز الدلالي المُحَفَّز بالصوت

Command Palette

التمييز الدلالي المُحَفَّز بالصوت

Command Palette

التمييز الدلالي المُحَفَّز بالصوت