HyperAIHyperAI

Command Palette

Search for a command to run...

Reconnaissance assistée par le langage naturel des langues des signes

Ronglai Zuo Fangyun Wei Brian Mak

Résumé

Les langues des signes sont des langues visuelles qui transmettent l’information à travers la forme des mains, les expressions faciales, les mouvements corporels, etc. En raison des contraintes inhérentes aux combinaisons de ces éléments visuels, les langues des signes comportent un nombre important de signes visuellement indiscernables (VISigns), ce qui limite la capacité de reconnaissance des réseaux neuronaux visuels. Pour atténuer ce problème, nous proposons un cadre de reconnaissance des langues des signes assistée par le langage naturel (NLA-SLR), qui exploite l’information sémantique contenue dans les glosses (étiquettes des signes). Premièrement, pour les VISigns ayant des significations sémantiques similaires, nous proposons un lissage des étiquettes sensible au langage, en générant des étiquettes souples pour chaque signe d’entraînement, dont les poids de lissage sont calculés à partir des similarités sémantiques normalisées entre les glosses, afin de faciliter l’entraînement. Deuxièmement, pour les VISigns ayant des significations sémantiques distinctes, nous introduisons une technique de mixup inter-modale qui fusionne les caractéristiques visuelles et les caractéristiques de gloss afin de maximiser davantage la séparabilité entre les différents signes sous la supervision d’étiquettes combinées. En outre, nous proposons également un nouveau modèle de base, le réseau vidéo-keystones, qui modélise à la fois les vidéos RGB et les points clés du corps humain, tout en extrayant des connaissances à partir de vidéos de signes présentant différents champs de réception temporelle. Expérimentalement, notre méthode atteint des performances de pointe sur trois benchmarks largement utilisés : MSASL, WLASL et NMFs-CSL. Le code est disponible à l’adresse suivante : https://github.com/FangyunWei/SLRT.


Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp
Reconnaissance assistée par le langage naturel des langues des signes | Articles | HyperAI