HyperAIHyperAI

Command Palette

Search for a command to run...

المتحدثون النشطون في السياق

Juan León Alcázar Fabian Caba Heilbron Long Mai Federico Perazzi Joon-Young Lee Pablo Arbeláez Bernard Ghanem

الملخص

الطرق الحالية للكشف عن المتحدث النشط تركز على نمذجة المعلومات السمعية والبصرية قصيرة المدى من متحدث واحد. رغم أن هذه الاستراتيجية قد تكون كافية للتعامل مع سيناريوهات المتحدث الواحد، إلا أنها تحول دون الكشف الدقيق عن المتحدث عندما يكون الهدف هو تحديد أي من العديد من المتحدثين المرشحين هم الذين يتحدثون. يقدم هذا البحث تمثيلًا جديدًا يُعرف بـ "سياق المتحدث النشط" (Active Speaker Context)، وهو يهدف إلى نمذجة العلاقات بين عدة متحدثين على مدى فترات زمنية طويلة. صُمم سياق المتحدث النشط لدينا لتعلم العلاقات الثنائية والعلاقات الزمنية من مجموعة منظمة للملاحظات السمعية والبصرية. تظهر تجاربنا أن مجموعة الخصائص المنظمة تحسن بالفعل أداء الكشف عن المتحدث النشط. علاوة على ذلك، وجدنا أن سياق المتحدث النشط المقترح يتفوق على أفضل ما وصل إليه العلم في مجموعة بيانات AVA-ActiveSpeaker، حيث حقق نسبة mAP قدرها 87.1٪. نقدم دراسات تقليصية تؤكد أن هذا النتيجة هي نتيجة مباشرة لتحليلنا طويل المدى لمجموعة المتحدثين المتعددين.


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp
المتحدثون النشطون في السياق | مستندات | HyperAI