HyperAIHyperAI
il y a 17 jours

Conversion du point de vue des messages adressés aux assistants virtuels

Isabelle G. Lee, Vera Zu, Sai Srujana Buddi, Dennis Liang, Purva Kulkarni, Jack G.M. Fitzgerald
Conversion du point de vue des messages adressés aux assistants virtuels
Résumé

Les assistants virtuels peuvent parfois être très littéraux. Si l'utilisateur dit « dis à Bob que je l'aime », la plupart des assistants virtuels extraient simplement le message « je l'aime » et l'envoient au contact nommé Bob, plutôt que de le reformuler correctement en « je t'aime ». Nous avons conçu un système permettant à un assistant virtuel de recevoir un message vocal d’un utilisateur, de transformer le point de vue du message, puis de le transmettre au destinataire final. Nous avons développé un modèle basé sur des règles, intégrant un modèle de classification textuelle linéaire, une identification des parties du discours (POS tagging) et une analyse syntaxique (constituency parsing), combinés à des méthodes de transformation basées sur des règles. Nous avons également exploré des approches de traduction automatique par réseaux neuronaux (NMT), notamment des LSTMs, CopyNet et T5. Nous avons étudié cinq métriques pour évaluer automatiquement à la fois la naturelles et la fidélité du résultat, et avons choisi d’utiliser BLEU et METEOR pour mesurer la fidélité, tandis que la perplexité relative basée sur un modèle de langage entraîné séparément (GPT) servait à évaluer la naturelles. Transformer-Copynet et T5 se sont révélés comparables en termes de fidélité, T5 remportant légèrement la palme avec un score BLEU de 63,8 et un score METEOR de 83,0. CopyNet a obtenu les meilleurs résultats en termes de naturelles, avec une perplexité relative de 1,59. De plus, CopyNet possède 37 fois moins de paramètres que T5. Nous avons rendu publique notre base de données, composée de 46 565 échantillons collectés via un crowd-sourcing.