HyperAIHyperAI

Command Palette

Search for a command to run...

Intégration radiale profonde pour l'apprentissage de séquences visuelles

Xilin Chen Xiujuan Chai Lei Lei Xiaotao Wang Yanan Li Peiqi Jiao Yuecong Min

Résumé

La Classification Temporelle Connexionniste (CTC) est une fonction objectif largement utilisée dans la reconnaissance de séquences, qui fournit une supervision pour des données de séquences non segmentées en effectuant une alignement itératif entre la séquence et son étiquetage correspondant. La classe vide (blank) dans CTC joue un rôle crucial dans le processus d’alignement et est souvent considérée comme responsable du phénomène de « picage » (peaky behavior) observé dans CTC. Dans cette étude, nous proposons une nouvelle fonction objectif nommée RadialCTC, qui contraint les caractéristiques de séquence à être situées sur une hypersphère tout en préservant le mécanisme d’alignement itératif de CTC. Les caractéristiques apprises pour chaque classe non vide sont réparties le long d’un arc radial partant du centre de la classe vide, offrant ainsi une interprétation géométrique claire et rendant le processus d’alignement plus efficace. En outre, RadialCTC permet de contrôler le phénomène de picage en modifiant simplement le logit associé à la classe vide. Les résultats expérimentaux en reconnaissance et localisation démontrent l’efficacité de RadialCTC sur deux applications de reconnaissance de séquences.


Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp
Intégration radiale profonde pour l'apprentissage de séquences visuelles | Articles | HyperAI