HyperAIHyperAI

Command Palette

Search for a command to run...

Unité de Mémoire Rotative

["name": "Rumen Dangovski*" "affiliation": "Massachusetts Institute of Technology" "email": "[email protected]" "name": "Li Jing*" "affiliation": "Massachusetts Institute of Technology" "email": "[email protected]" "name": "Marin Solja\u010di\u0107" "affiliation": "Massachusetts Institute of Technology" "email": "[email protected]"]

Résumé

Les concepts de matrices d'évolution unitaires et de mémoire associative ont propulsé le domaine des Réseaux de Neurones Récurents (RNN) vers des performances de pointe dans diverses tâches séquentielles. Cependant, les RNN ont encore une capacité limitée à manipuler la mémoire à long terme. Pour contourner cette faiblesse, les applications les plus réussies des RNN utilisent des techniques externes telles que les mécanismes d'attention. Dans cet article, nous proposons un nouveau modèle de RNN qui unifie les approches de pointe : l'Unité de Mémoire Rotationnelle (RUM). Le cœur du RUM est son opération rotationnelle, qui est naturellement une matrice unitaire, offrant aux architectures la possibilité d'apprendre des dépendances à long terme en surmontant le problème des gradients qui s'évanouissent ou explosent. De plus, l'unité rotationnelle sert également de mémoire associative. Nous évaluons notre modèle sur des tâches synthétiques de mémorisation, de réponse à des questions et de modélisation linguistique. Le RUM apprend complètement la tâche Copying Memory et améliore le résultat actuel dans la tâche Recall. Les performances du RUM dans la tâche bAbI Question Answering sont comparables à celles des modèles dotés d'un mécanisme d'attention. Nous améliorons également le résultat actuel à 1,189 bit par caractère (BPC) dans la tâche Character Level Penn Treebank (PTB), ce qui signifie l'application du RUM aux données séquentielles réelles. L'universalité de notre construction au cœur des RNN établit le RUM comme une approche prometteuse pour la modélisation linguistique, la reconnaissance vocale et la traduction automatique.


Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp