HyperAIHyperAI

Command Palette

Search for a command to run...

هل تتحرك كما تتحدث؟ استكشاف تصنيف إجراءات السائق القائمة على الوضع باستخدام شبكات اعتراف بالصوت

Ángel Llamazares Miguel Antunes Santiago Montiel-Marín Luis M. Bergasa Pablo Pardo-Decimavilla

الملخص

تمييز المشتتات على الطرق أمر بالغ الأهمية لتقليل الحوادث المرورية. تُستخدم عادةً الشبكات القائمة على الفيديو، لكنها محدودة من حيث التكلفة الحسابية وتكون عرضة لتغيرات الزاوية المرئية. في هذا البحث، نقترح منهجية جديدة لتصنيف أفعال السائق بناءً على وضعية الجسم باستخدام شبكات معالجة الصوت، وهي أخف وزناً وأكثر مقاومة لتغيرات الزاوية مقارنة بالطرق القائمة على الفيديو. نستفيد من التشابه في ترميز المعلومات بين بيانات الصوت والوضعية، حيث نمثل الوضعيات كنقاط رئيسية عبر الزمن. تعتمد هندستنا على نموذج Squeezeformer، وهو نموذج فعّال قائمة على الانتباه لمعالجة الصوت. كما نقدم مجموعة من تقنيات تضخيم البيانات لتعزيز القدرة على التعميم. أظهرت التجارب على مجموعة بيانات Drive&Act أداءً متفوقاً مقارنة بالطرق الرائدة حديثاً. علاوة على ذلك، نستعرض دمج معلومات الكائنات ونحلل تأثير تغيرات الزاوية. تُبرز نتائجنا فعالية ومتانة شبكات معالجة الصوت في تصنيف الأفعال القائمة على الوضعية.


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp