HyperAIHyperAI
il y a 17 jours

Modélisation acoustique à étape unique basée sur le CRF avec topologie CTC

{Zhijian Ou, Hongyu Xiang}
Modélisation acoustique à étape unique basée sur le CRF avec topologie CTC
Résumé

Dans cet article, nous développons un modèle acoustique à étape unique (SS) basé sur les champs aléatoires conditionnels (CRF) avec une topologie d’états inspirée de la classification temporelle connexionniste (CTC), que nous désignons abusivement par CTC-CRF.Le modèle CTC-CRF est conceptuellement simple : il met essentiellement en œuvre une couche CRF au-dessus des caractéristiques générées par un réseau neuronal profond en utilisant une topologie d’états particulière. Contrairement aux approches traditionnelles, comme les modèles GMM-HMM, le CTC-CRF peut être entraîné de zéro (en mode « flat-start »), sans nécessiter d’étape préalable d’entraînement des GMM-HMM ni de construction d’arbre de codage, tout comme le modèle SS-LF-MMI (maximum d’information mutuelle sans grille). Des expérimentations d’évaluation ont été menées sur les jeux de données WSJ, Switchboard et Librispeech. Dans un comparatif direct, le modèle CTC-CRF utilisant des réseaux LSTM bidirectionnels simples dépasse de manière constante le modèle SS-LF-MMI fort sur les trois jeux de données de référence, que l’on considère des mono-phone ou des mono-caractères. En outre, le CTC-CRF évite certaines opérations ad hoc présentes dans le cadre de SS-LF-MMI, améliorant ainsi la simplicité et la robustesse de l’approche.

Modélisation acoustique à étape unique basée sur le CRF avec topologie CTC | Articles de recherche récents | HyperAI