HyperAIHyperAI

Command Palette

Search for a command to run...

Un modèle ne suffit pas : les ensembles pour la reconnaissance des langues des signes isolées

Zdeněk Krňoul Miroslav Hlaváč Matyáš Boháček Jakub Kanis Ivan Gruber Marek Hrúz

Résumé

Dans cet article, nous nous penchons sur la reconnaissance des langues des signes, en nous concentrant sur la reconnaissance des signes isolés. Cette tâche est formulée comme un problème de classification, dans lequel une séquence d'images (c’est-à-dire des trames) est identifiée comme l’un des glossaires de langue des signes prédéfinis. Nous analysons deux approches basées sur l’apparence : I3D et TimeSformer, ainsi qu’une approche basée sur la posture : SPOTER. Les approches basées sur l’apparence sont entraînées sur différentes modalités de données, tandis que les performances de SPOTER sont évaluées sur divers types de prétraitement. Toutes ces méthodes sont testées sur deux jeux de données publiques : AUTSL et WLASL300. Nous expérimentons des techniques d’ensembles afin d’obtenir de nouveaux résultats état-de-l’art atteignant 73,84 % de précision sur le jeu de données WLASL300, en utilisant la méthode d’optimisation CMA-ES pour déterminer les meilleurs paramètres de poids dans l’ensemble. En outre, nous proposons une technique d’ensemblage fondée sur le modèle Transformer, que nous appelons Neural Ensembler.


Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp
Un modèle ne suffit pas : les ensembles pour la reconnaissance des langues des signes isolées | Articles | HyperAI