HyperAI

Sound Prompted Semantic Segmentation

تقوم مهمة التقطيع الدلالي المُحفز بالصوت بدمج الرؤية الحاسوبية مع معالجة الإشارات الصوتية، بهدف التنبؤ بقناع التقطيع الدلالي للأشياء المقابلة في الصورة بناءً على الإشارات الصوتية المعطاة. تعتمد هذه المهمة على معلومات الصوت لتعزيز الفهم البصري، مما يحسن دقة ومتانة التعرف على الأهداف، ولها قيمة تطبيقية كبيرة في مجالات مثل المراقبة الذكية، القيادة الذاتية، والتفاعل بين الإنسان والحاسوب.