Articles de recherche récents
Articles de recherche sur l'IA mis à jour quotidiennement pour vous aider à suivre les dernières tendances en matière d'IA

BANG : Division de ressources 3D par dynamique éclatée générative
Longwen Zhang, Qixuan Zhang, Haoran Jiang, et al.
il y a 17 jours

ScreenCoder : Progresser dans la génération visuelle vers le code pour l'automatisation du front-end grâce à des agents multimodaux modulaires
Yilei Jiang, Yaozhi Zheng, Yuxuan Wan, et al.
il y a 17 jours

MIRepNet : Une chaîne de traitement et un modèle fondamental pour la classification de l’imagerie motrice à partir d’EEG
Dingkun Liu, Zhu Chen, Jingwei Luo, et al.
il y a 17 jours

ChemDFM-R : Un raisonneur chimique basé sur un modèle linguistique grand (LLM) amélioré par des connaissances chimiques atomisées
Zihan Zhao, Bo Chen, Ziping Wan, et al.
il y a 17 jours

X-Omni : Le apprentissage par renforcement rend aux modèles de génération d’images autoregressifs discrets leur grandeur d’antan
Zigang Geng, Yibing Wang, Yeyao Ma, et al.
il y a 17 jours

HunyuanWorld 1.0 : Génération de mondes 3D immersifs, explorables et interactifs à partir de mots ou de pixels
HunyuanWorld Team, Zhenwei Wang, Yuhao Liu, et al.
il y a 17 jours

AlphaEarth Foundations : un modèle de champ d'embeddings pour une cartographie globale précise et efficace à partir de données étiquetées éparses
Christopher F. Brown, Michal R. Kazmierski, Valerie J. Pasquarella, et al.
il y a 17 jours

Vers une prévision à longue portée de l'ENSO à l'aide d'un modèle d'apprentissage profond explicite
Qi Chen, Yinghao Cui, Guobin Hong, et al.
il y a 17 jours

OmniArch : Construction d'un modèle fondamental pour le calcul scientifique
Tianyu Chen, Haoyi Zhou, Ying Li, et al.
il y a 17 jours

UI-AGILE : Approfondir les agents d'interface utilisateur avec un apprentissage par renforcement efficace et une ancrage précis au moment de l'inférence
Shuquan Lian, Yuhang Wu, Jia Ma, et al.
il y a 18 jours

DualSG : Un cadre de prévision des séries temporelles multivariées à guide sémantique explicite à deux flux
Kuiye Ding, Fanda Fan, Yao Wang, et al.
il y a 18 jours

Lorsque les tokens parlent trop : Une revue de la compression de tokens à longue portée multimodaux dans les images, vidéos et audios
Kele Shao, Keda Tao, Kejia Zhang, et al.
il y a 19 jours

SmallThinker : Une famille de modèles de langage à grande échelle efficaces entraînés nativement pour le déploiement local
Yixin Song, Zhenliang Xue, Dongliang Wei, et al.
il y a 19 jours

Reconstruction de l'intelligence spatiale 4D : Un état de l'art
Yukang Cao, Jiahao Lu, Zhisheng Huang, et al.
il y a 19 jours

Rep-MTL : Déverrouiller le pouvoir de la salience des tâches au niveau de la représentation pour l'apprentissage multi-tâches
Zedong Wang, Siyuan Li, Dan Xu
il y a 19 jours

ARC-Hunyuan-Video-7B : Compréhension structurée des vidéos du monde réel en courte durée
Yuying Ge, Yixiao Ge, Chen Li, et al.
il y a 19 jours

Optimisation de politique renforcée agente
Guanting Dong, Hangyu Mao, Kai Ma, et al.
il y a 19 jours

Une revue des agents auto-évoluants : Vers une intelligence artificielle superieure
Huan-ang Gao, Jiayi Geng, Wenyue Hua, et al.
il y a 19 jours

Spécification de correction auto : atténuer le piratage de récompense en contexte par une révision au moment des tests
V\u00edctor Gallego
il y a 20 jours

PRIX : Apprendre à planifier à partir de pixels bruts pour le pilotage autonome en boucle complète
Maciej K. Wozniak, Lianhang Liu, Yixi Cai, et al.
il y a 20 jours

Chat avec l'IA : La tournure surprenante de la communication vidéo en temps réel passant d'un humain à une IA
Jiangkai Wu, Zhiyuan Ren, Liming Liu, et al.
il y a 20 jours

MMBench-GUI : Cadre d'évaluation hiérarchique pour les agents GUI multiplateformes
Xuehui Wang, Zhenyu Wu, JingJing Xie, et al.
il y a 20 jours

Recherche profonde avec diffusion en temps de test
Rujun Han, Yanfei Chen, Zoey CuiZhu, et al.
il y a 20 jours

La géométrie de la quantification des LLM : GPTQ comme l'algorithme du plan le plus proche de Babai
Jiale Chen, Torsten Hoefler, Dan Alistarh
il y a 20 jours

MedIQA : Un modèle fondamental évolutif pour l'évaluation de la qualité des images médicales basée sur les prompts
Siyi Xun, Yue Sun, Jingkun Chen, et al.
il y a 20 jours

OS-MAP : Jusqu'où peuvent aller les agents utilisant l'ordinateur en termes de largeur et de profondeur ?
Xuetian Chen, Yinghao Chen, Xinfeng Yuan, et al.
il y a 20 jours

Optimisation de la politique budgétaire hiérarchique pour le raisonnement adaptatif
Shangke Lyu, Linjuan Wu, Yuchen Yan, et al.
il y a 21 jours

Captain Cinema : Vers la génération de courts métrages
Junfei Xiao, Ceyuan Yang, Lvmin Zhang, et al.
il y a 21 jours

LAPO : L'optimisation adaptative de la politique par l'intégration de l'efficacité du raisonnement
Xingyu Wu, Yuchen Yan, Shangke Lyu, et al.
il y a 21 jours

MUR : Raisonnement guidé par l'incertitude de la quantité de mouvement pour les grands modèles linguistiques
Hang Yan, Fangzhi Xu, Rongman Xu, et al.
il y a 21 jours