Command Palette
Search for a command to run...
Papers
Articles de recherche en IA de pointe mis à jour quotidiennement pour vous aider à suivre les dernières tendances en IA

Réparation chirurgicale des têtes d'attention effondrées dans les transformateurs ALiBi

r-GAT : Réseau d'attention de graphe relationnel pour les graphes multi-relationnels

Explorer la diffusion élastique cohérente neutrino-noyau des neutrinos de réacteur avec l'expérience NUCLEUS






Réparation chirurgicale des têtes d'attention effondrées dans les transformateurs ALiBi

r-GAT : Réseau d'attention de graphe relationnel pour les graphes multi-relationnels

Explorer la diffusion élastique cohérente neutrino-noyau des neutrinos de réacteur avec l'expérience NUCLEUS





Un modèle de mémoire à long court terme (LSTM) pour l'analyse du sentiment commercial basé sur un réseau neuronal récurrent
Normalisation par exemple pour l'apprentissage de représentation profonde
Normalisation par lots étendue
Encodages positionnels rotatifs comme modulation de phase : Bornes théoriques sur la base RoPE pour les transformateurs à contexte long
Battre le meilleur : Améliorer AlphaFold2 dans la prédiction de la structure des protéines
Un modèle de mémoire à long court terme (LSTM) pour l'analyse du sentiment commercial basé sur un réseau neuronal récurrent
Normalisation par exemple pour l'apprentissage de représentation profonde
Normalisation par lots étendue
Encodages positionnels rotatifs comme modulation de phase : Bornes théoriques sur la base RoPE pour les transformateurs à contexte long
Battre le meilleur : Améliorer AlphaFold2 dans la prédiction de la structure des protéines