HyperAIHyperAI

Articles de recherche récents

Articles de recherche sur l'IA mis à jour quotidiennement pour vous aider à suivre les dernières tendances en matière d'IA

Intelligence Artificielle Holistique en Médecine ; Amélioration des Performances et de l'Explicabilité
Intelligence Artificielle Holistique en Médecine ; Amélioration des Performances et de l'Explicabilité
Periklis Petridis, Georgios Margaritis, Vasiliki Stoumpou, et al.
il y a un mois
Évolution des prompts en contexte : une perspective ouverte et auto-répliquante
Évolution des prompts en contexte : une perspective ouverte et auto-répliquante
Wang, Jianyu, Hu, et al.
il y a un mois
SPIRAL : L'auto-jeu dans les jeux à somme nulle incite à la réflexion par le biais de l'apprentissage par renforcement multi-agents et multi-tours
SPIRAL : L'auto-jeu dans les jeux à somme nulle incite à la réflexion par le biais de l'apprentissage par renforcement multi-agents et multi-tours
Bo Liu, Leon Guertler, Simon Yu, et al.
il y a un mois
Pensée Récompensée par l'Auditeur dans les VLMs pour les Préférences d'Images
Pensée Récompensée par l'Auditeur dans les VLMs pour les Préférences d'Images
Alexander Gambashidze, Li Pengyi, Matvey Skripkin, et al.
il y a un mois
Calligrapher : Personnalisation d'images textuelles en style libre
Calligrapher : Personnalisation d'images textuelles en style libre
Yue Ma, Qingyan Bai, Hao Ouyang, et al.
il y a un mois
VMoBA : Mélange d'Attention par Blocs pour les Modèles de Diffusion Vidéo
VMoBA : Mélange d'Attention par Blocs pour les Modèles de Diffusion Vidéo
Jianzong Wu, Liang Hou, Haotian Yang, et al.
il y a un mois
Rapport technique Ovis-U1
Rapport technique Ovis-U1
Guo-Hua Wang, Shanshan Zhao, Xinjie Zhang, et al.
il y a un mois
SMMILE : Un Benchmark Dirigé par des Experts pour l'Apprentissage Multimodal Médical en Contexte
SMMILE : Un Benchmark Dirigé par des Experts pour l'Apprentissage Multimodal Médical en Contexte
Melanie Rieff, Maya Varma, Ossian Rabow, et al.
il y a un mois
Le Benchmark Automatisé de Speedrunning pour les LLM : Reproduction des Améliorations de NanoGPT
Le Benchmark Automatisé de Speedrunning pour les LLM : Reproduction des Améliorations de NanoGPT
Bingchen Zhao, Despoina Magka, Minqi Jiang, et al.
il y a un mois
Shape-for-Motion : Édition vidéo précise et cohérente avec un proxy 3D
Shape-for-Motion : Édition vidéo précise et cohérente avec un proxy 3D
Yuhao Liu, Tengfei Wang, Fang Liu, et al.
il y a un mois
De l’idéal au réel : Prédiction dense unifiée et efficace en données pour des scénarios du monde réel
De l’idéal au réel : Prédiction dense unifiée et efficace en données pour des scénarios du monde réel
Changliang Xia, Chengyou Jia, Zhuohang Dang, et al.
il y a un mois
ShotBench : Compréhension Cinématographique de Niveau Expert dans les Modèles Vision-Langue
ShotBench : Compréhension Cinématographique de Niveau Expert dans les Modèles Vision-Langue
Hongbo Liu, Jingwen He, Yi Jin, et al.
il y a un mois
XVerse : Contrôle cohérent de l'identité et des attributs sémantiques de plusieurs sujets par modulation DiT
XVerse : Contrôle cohérent de l'identité et des attributs sémantiques de plusieurs sujets par modulation DiT
Bowen Chen, Mengyi Zhao, Haomiao Sun, et al.
il y a un mois
Conception d'anticorps à zéro coup d'essai dans une plaque à 24 puits
Conception d'anticorps à zéro coup d'essai dans une plaque à 24 puits
Chai Discovery Team
il y a un mois
KinFormer : Régression symbolique dynamique généralisable pour la cinématique des réactions organiques catalytiques
KinFormer : Régression symbolique dynamique généralisable pour la cinématique des réactions organiques catalytiques
Jindou Chen, Jidong Tian, Liang Wu, et al.
il y a un mois
MiCo : Contraste multi-image pour le raisonnement visuel renforcé
MiCo : Contraste multi-image pour le raisonnement visuel renforcé
Xi Chen, Mingkang Zhu, Shaoteng Liu, et al.
il y a un mois
L'optimisation fine-grainée des préférences améliore le raisonnement spatial dans les VLMs.
L'optimisation fine-grainée des préférences améliore le raisonnement spatial dans les VLMs.
Yifan Shen, Yuanzhe Liu, Jingyuan Zhu, et al.
il y a un mois
ARK : Un cadre open-source basé sur Python pour l'apprentissage robotique
ARK : Un cadre open-source basé sur Python pour l'apprentissage robotique
Magnus Dierking, Christopher E. Mower, Sarthak Das, et al.
il y a un mois
Pangu Pro MoE : Mélange d'Experts Groupés pour une Éparsité Efficace
Pangu Pro MoE : Mélange d'Experts Groupés pour une Éparsité Efficace
Tang, Yehui, Li, et al.
il y a un mois
LLaVA-Scissor : Compression de jetons avec des composantes sémantiques connexes pour les LLMs vidéo
LLaVA-Scissor : Compression de jetons avec des composantes sémantiques connexes pour les LLMs vidéo
Boyuan Sun, Jiaxing Zhao, Xihan Wei, et al.
il y a un mois
BlenderFusion : Édition visuelle basée sur le 3D et composition générative
BlenderFusion : Édition visuelle basée sur le 3D et composition générative
Chen, Jiacheng, Mehran, et al.
il y a un mois
UniMate : Un Modèle Unifié pour la Génération de Matériaux Mécaniques Métamériques, la Prédiction de leurs Propriétés et la Confirmation de leur État
UniMate : Un Modèle Unifié pour la Génération de Matériaux Mécaniques Métamériques, la Prédiction de leurs Propriétés et la Confirmation de leur État
Wangzhi Zhan, Jianpeng Chen, Dongqi Fu, et al.
il y a un mois
HealthGPT : Un grand modèle de vision-langue médical pour unifier la compréhension et la génération par l'adaptation de connaissances hétérogènes
HealthGPT : Un grand modèle de vision-langue médical pour unifier la compréhension et la génération par l'adaptation de connaissances hétérogènes
Tianwei Lin, Wenqiao Zhang, Sijing Li, et al.
il y a un mois
Apprendre à Omettre les Couches Intermédiaires des Transformers
Apprendre à Omettre les Couches Intermédiaires des Transformers
Tim Lawson, Laurence Aitchison
il y a un mois
SAM4D : Segmenter Tout dans les Flux Caméra et LiDAR
SAM4D : Segmenter Tout dans les Flux Caméra et LiDAR
Jianyun Xu, Song Wang, Ziqian Ni, et al.
il y a un mois
Où trouver le Grokking dans la préformation des LLM ? Surveillance de la mémorisation à la généralisation sans test
Où trouver le Grokking dans la préformation des LLM ? Surveillance de la mémorisation à la généralisation sans test
Ziyue Li, Chenrui Fan, Tianyi Zhou
il y a un mois
FineWeb2 : Une seule pipeline pour les adapter toutes -- Adaptation du traitement des données d'apprentissage préalable à chaque langue
FineWeb2 : Une seule pipeline pour les adapter toutes -- Adaptation du traitement des données d'apprentissage préalable à chaque langue
Guilherme Penedo, Hynek Kydl\u00ed\u010dek, Vinko Sabol\u010dec, et al.
il y a un mois
MADrive : Modélisation des Scènes de Conduite Augmentée par la Mémoire
MADrive : Modélisation des Scènes de Conduite Augmentée par la Mémoire
Polina Karpikova, Daniil Selikhanovych, Kirill Struminsky, et al.
il y a un mois
FaSTA^* : Agent de Trajectoire Rapide-Lente avec Extraction de Sous-routines pour une Édition d'Images Multitour Efficace
FaSTA^* : Agent de Trajectoire Rapide-Lente avec Extraction de Sous-routines pour une Édition d'Images Multitour Efficace
Advait Gupta, Rishie Raj, Dang Nguyen, et al.
il y a un mois
Mind2Web 2 : Évaluation de la recherche agente avec l’agent en tant que juge
Mind2Web 2 : Évaluation de la recherche agente avec l’agent en tant que juge
Boyu Gou, Zanming Huang, Yuting Ning, et al.
il y a 2 mois