HyperAI

Articles de recherche récents

Articles de recherche sur l'IA mis à jour quotidiennement pour vous aider à suivre les dernières tendances en matière d'IA

Réexaminer l'interaction intermodale dans les transformateurs de diffusion multimodaux
Réexaminer l'interaction intermodale dans les transformateurs de diffusion multimodaux
Zhengyao Lv, Tianlin Pan, Chenyang Si, et al.
Date de publication: 6/10/2025
Reconstruction d'image comme outil d'analyse des caractéristiques
Reconstruction d'image comme outil d'analyse des caractéristiques
Eduard Allakhverdov, Dmitrii Tarasov, Elizaveta Goncharova, et al.
Date de publication: 6/10/2025
Astra : Vers des robots mobiles à usage général grâce à l'apprentissage multimodal hiérarchique
Astra : Vers des robots mobiles à usage général grâce à l'apprentissage multimodal hiérarchique
Sheng Chen, Peiyu He, Jiaxin Hu, et al.
Date de publication: 6/10/2025
SpatialLM : Formation de grands modèles de langage pour la modélisation structurée des espaces intérieurs
SpatialLM : Formation de grands modèles de langage pour la modélisation structurée des espaces intérieurs
Yongsen Mao, Junhao Zhong, Chuan Fang, et al.
Date de publication: 6/10/2025
OneIG-Bench : Évaluation Nuancée Omnidimensionnelle pour la Génération d'Images
OneIG-Bench : Évaluation Nuancée Omnidimensionnelle pour la Génération d'Images
Jingjing Chang, Yixiao Fang, Peng Xing, et al.
Date de publication: 6/10/2025
Génération proactive de dialogues d'assistant à partir de vidéos égocentriques en flux continu
Génération proactive de dialogues d'assistant à partir de vidéos égocentriques en flux continu
Yichi Zhang, Xin Luna Dong, Zhaojiang Lin, et al.
Date de publication: 6/10/2025
PersonaAgent : Lorsque les agents de grands modèles linguistiques rencontrent la personnalisation au moment du test
PersonaAgent : Lorsque les agents de grands modèles linguistiques rencontrent la personnalisation au moment du test
Weizhi Zhang, Xinyang Zhang, Chenwei Zhang, et al.
Date de publication: 6/10/2025
Modèles de langage grand format sensibles au son comme juges des styles de parole
Modèles de langage grand format sensibles au son comme juges des styles de parole
Cheng-Han Chiang, Xiaofei Wang, Chung-Ching Lin, et al.
Date de publication: 6/9/2025
MORSE-500 : Une Benchmark Vidéo Contrôlable par Programme pour Tester sous Contrainte le Raisonnement Multimodal
MORSE-500 : Une Benchmark Vidéo Contrôlable par Programme pour Tester sous Contrainte le Raisonnement Multimodal
Zikui Cai, Andrew Wang, Anirudh Satheesh, et al.
Date de publication: 6/9/2025
Utilisation de l'auto-attention pour le prompting souple dépendant de l'entrée dans les LLMs
Utilisation de l'auto-attention pour le prompting souple dépendant de l'entrée dans les LLMs
Ananth Muppidi, Abhilash Nandy, Sambaran Bandyopadhyay
Date de publication: 6/9/2025