HyperAIHyperAI

Command Palette

Search for a command to run...

AIN : Étiquetage de séquences rapide et précis grâce au réseau d'inférence approchée

Xinyu Wang Yong Jiang Nguyen Bach Tao Wang Zhongqiang Huang Fei Huang Kewei Tu

Résumé

Le modèle de Champ Aléatoire Conditionnel (CRF) à chaîne linéaire est l'une des approches les plus couramment utilisées pour l'étiquetage de séquences par réseaux neuronaux. Des algorithmes d'inférence probabiliste exacte, tels que les algorithmes forward-backward et Viterbi, sont généralement appliqués aux étapes d'entraînement et de prédiction du modèle CRF. Toutefois, ces algorithmes nécessitent un calcul séquentiel, ce qui rend leur parallélisation impossible. Dans cet article, nous proposons d'utiliser un algorithme d'inférence variationnelle approchée parallélisable pour le modèle CRF. À partir de cet algorithme, nous concevons un réseau d'inférence approchée pouvant être connecté au encodeur du modèle CRF neuronal afin de former un réseau end-to-end, facilement parallélisable pour accélérer l'entraînement et la prédiction. Les résultats expérimentaux montrent que notre approche permet une amélioration de 12,7 fois en vitesse de décodage sur des phrases longues, tout en atteignant une précision compétitive par rapport à l'approche CRF traditionnelle.


Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp