Articles de recherche récents
Articles de recherche sur l'IA mis à jour quotidiennement pour vous aider à suivre les dernières tendances en matière d'IA

Intelligence Artificielle Holistique en Médecine ; Amélioration des Performances et de l'Explicabilité
Periklis Petridis, Georgios Margaritis, Vasiliki Stoumpou, et al.
il y a un mois

Évolution des prompts en contexte : une perspective ouverte et auto-répliquante
Wang, Jianyu, Hu, et al.
il y a un mois

SPIRAL : L'auto-jeu dans les jeux à somme nulle incite à la réflexion par le biais de l'apprentissage par renforcement multi-agents et multi-tours
Bo Liu, Leon Guertler, Simon Yu, et al.
il y a un mois

Pensée Récompensée par l'Auditeur dans les VLMs pour les Préférences d'Images
Alexander Gambashidze, Li Pengyi, Matvey Skripkin, et al.
il y a un mois

Calligrapher : Personnalisation d'images textuelles en style libre
Yue Ma, Qingyan Bai, Hao Ouyang, et al.
il y a un mois

VMoBA : Mélange d'Attention par Blocs pour les Modèles de Diffusion Vidéo
Jianzong Wu, Liang Hou, Haotian Yang, et al.
il y a un mois

Rapport technique Ovis-U1
Guo-Hua Wang, Shanshan Zhao, Xinjie Zhang, et al.
il y a un mois

SMMILE : Un Benchmark Dirigé par des Experts pour l'Apprentissage Multimodal Médical en Contexte
Melanie Rieff, Maya Varma, Ossian Rabow, et al.
il y a un mois

Le Benchmark Automatisé de Speedrunning pour les LLM : Reproduction des Améliorations de NanoGPT
Bingchen Zhao, Despoina Magka, Minqi Jiang, et al.
il y a un mois

Shape-for-Motion : Édition vidéo précise et cohérente avec un proxy 3D
Yuhao Liu, Tengfei Wang, Fang Liu, et al.
il y a un mois

De l’idéal au réel : Prédiction dense unifiée et efficace en données pour des scénarios du monde réel
Changliang Xia, Chengyou Jia, Zhuohang Dang, et al.
il y a un mois

ShotBench : Compréhension Cinématographique de Niveau Expert dans les Modèles Vision-Langue
Hongbo Liu, Jingwen He, Yi Jin, et al.
il y a un mois

XVerse : Contrôle cohérent de l'identité et des attributs sémantiques de plusieurs sujets par modulation DiT
Bowen Chen, Mengyi Zhao, Haomiao Sun, et al.
il y a un mois

Conception d'anticorps à zéro coup d'essai dans une plaque à 24 puits
Chai Discovery Team
il y a un mois

KinFormer : Régression symbolique dynamique généralisable pour la cinématique des réactions organiques catalytiques
Jindou Chen, Jidong Tian, Liang Wu, et al.
il y a un mois

MiCo : Contraste multi-image pour le raisonnement visuel renforcé
Xi Chen, Mingkang Zhu, Shaoteng Liu, et al.
il y a un mois

L'optimisation fine-grainée des préférences améliore le raisonnement spatial dans les VLMs.
Yifan Shen, Yuanzhe Liu, Jingyuan Zhu, et al.
il y a un mois

ARK : Un cadre open-source basé sur Python pour l'apprentissage robotique
Magnus Dierking, Christopher E. Mower, Sarthak Das, et al.
il y a un mois

Pangu Pro MoE : Mélange d'Experts Groupés pour une Éparsité Efficace
Tang, Yehui, Li, et al.
il y a un mois

LLaVA-Scissor : Compression de jetons avec des composantes sémantiques connexes pour les LLMs vidéo
Boyuan Sun, Jiaxing Zhao, Xihan Wei, et al.
il y a un mois

BlenderFusion : Édition visuelle basée sur le 3D et composition générative
Chen, Jiacheng, Mehran, et al.
il y a un mois

UniMate : Un Modèle Unifié pour la Génération de Matériaux Mécaniques Métamériques, la Prédiction de leurs Propriétés et la Confirmation de leur État
Wangzhi Zhan, Jianpeng Chen, Dongqi Fu, et al.
il y a un mois

HealthGPT : Un grand modèle de vision-langue médical pour unifier la compréhension et la génération par l'adaptation de connaissances hétérogènes
Tianwei Lin, Wenqiao Zhang, Sijing Li, et al.
il y a un mois

Apprendre à Omettre les Couches Intermédiaires des Transformers
Tim Lawson, Laurence Aitchison
il y a un mois

SAM4D : Segmenter Tout dans les Flux Caméra et LiDAR
Jianyun Xu, Song Wang, Ziqian Ni, et al.
il y a un mois

Où trouver le Grokking dans la préformation des LLM ? Surveillance de la mémorisation à la généralisation sans test
Ziyue Li, Chenrui Fan, Tianyi Zhou
il y a un mois

FineWeb2 : Une seule pipeline pour les adapter toutes -- Adaptation du traitement des données d'apprentissage préalable à chaque langue
Guilherme Penedo, Hynek Kydl\u00ed\u010dek, Vinko Sabol\u010dec, et al.
il y a un mois

MADrive : Modélisation des Scènes de Conduite Augmentée par la Mémoire
Polina Karpikova, Daniil Selikhanovych, Kirill Struminsky, et al.
il y a un mois

FaSTA^* : Agent de Trajectoire Rapide-Lente avec Extraction de Sous-routines pour une Édition d'Images Multitour Efficace
Advait Gupta, Rishie Raj, Dang Nguyen, et al.
il y a un mois

Mind2Web 2 : Évaluation de la recherche agente avec l’agent en tant que juge
Boyu Gou, Zanming Huang, Yuting Ning, et al.
il y a 2 mois