il y a 6 mois

Résumé

La détection des distractions sur la route est essentielle pour réduire les accidents de trafic. Les réseaux basés sur les vidéos sont généralement utilisés, mais ils sont limités par leur coût computationnel élevé et sont sensibles aux variations de point de vue. Dans cet article, nous proposons une nouvelle approche pour la classification des actions du conducteur basée sur la posture, utilisant des réseaux de reconnaissance vocale, qui sont plus légers et plus invariants par rapport aux changements de point de vue que les méthodes basées sur les vidéos. Nous exploitons la similarité dans le codage de l’information entre les données audio et les données de posture, en représentant les postures sous forme de points clés au fil du temps. Notre architecture repose sur Squeezeformer, un réseau efficace de reconnaissance vocale fondé sur l’attention. Nous introduisons une série de techniques d’augmentation de données afin d’améliorer la généralisation. Des expériences menées sur le jeu de données Drive&Act démontrent une performance supérieure par rapport aux méthodes de pointe. En outre, nous explorons l’intégration d’informations objets ainsi que l’impact des variations de point de vue. Nos résultats mettent en évidence l’efficacité et la robustesse des réseaux de reconnaissance vocale dans la classification d’actions basée sur la posture.

PDF source Voir le code

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA

GPU prêts à l’emploi

Tarifs les plus avantageux

Commencer Voir les tarifs

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour

Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin

Propulsé par MailChimp

HyperAI

il y a 6 mois

Reconnaissance D'action

Traitement Audio Et Vocal

Multimodal

Audio

Multimodal

Vision Par Ordinateur

Tâche

Ángel Llamazares Miguel Antunes Santiago Montiel-Marín Luis M. Bergasa Pablo Pardo-Decimavilla

Résumé

PDF source Voir le code

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA

GPU prêts à l’emploi

Tarifs les plus avantageux

Commencer Voir les tarifs

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour

Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin

Propulsé par MailChimp

HyperAI

il y a 6 mois

Reconnaissance D'action

Traitement Audio Et Vocal

Multimodal

Audio

Multimodal

Vision Par Ordinateur

Tâche

Ángel Llamazares Miguel Antunes Santiago Montiel-Marín Luis M. Bergasa Pablo Pardo-Decimavilla

Résumé

PDF source Voir le code

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA

GPU prêts à l’emploi

Tarifs les plus avantageux

Commencer Voir les tarifs

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour

Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin

Propulsé par MailChimp

Faites-vous preuve de comportement conforme à votre parole ? Exploration de la classification des actions de conducteur basée sur la pose à l’aide de réseaux de reconnaissance vocale | Articles | HyperAI

Command Palette

Faites-vous preuve de comportement conforme à votre parole ? Exploration de la classification des actions de conducteur basée sur la pose à l’aide de réseaux de reconnaissance vocale

Ángel Llamazares Miguel Antunes Santiago Montiel-Marín Luis M. Bergasa Pablo Pardo-Decimavilla

Résumé

Créer de l'IA avec l'IA

HyperAI Newsletters

Command Palette

Faites-vous preuve de comportement conforme à votre parole ? Exploration de la classification des actions de conducteur basée sur la pose à l’aide de réseaux de reconnaissance vocale

Ángel Llamazares Miguel Antunes Santiago Montiel-Marín Luis M. Bergasa Pablo Pardo-Decimavilla

Résumé

Créer de l'IA avec l'IA

HyperAI Newsletters

Command Palette

Faites-vous preuve de comportement conforme à votre parole ? Exploration de la classification des actions de conducteur basée sur la pose à l’aide de réseaux de reconnaissance vocale

Ángel Llamazares Miguel Antunes Santiago Montiel-Marín Luis M. Bergasa Pablo Pardo-Decimavilla

Résumé

Créer de l'IA avec l'IA

HyperAI Newsletters