Articles de recherche récents
Articles de recherche sur l'IA mis à jour quotidiennement pour vous aider à suivre les dernières tendances en matière d'IA

∇NABLA : Attention Adaptative par Bloc aux Voisinages
Dmitrii Mikhailov, Aleksey Letunovskiy, Maria Kovaleva, et al.
il y a 20 jours

Optimisation de la politique des séquences de groupe
Chujie Zheng, Shixuan Liu, Mingze Li, et al.
il y a 20 jours

SafeWork-R1 : Coévolution de la sécurité et de l'intelligence en vertu de la loi AI-45
Yicheng Bao, Guanxu Chen, Mingkang Chen, et al.
il y a 23 jours

Découpler la connaissance et le raisonnement dans les LLM : Une exploration basée sur la théorie des deux systèmes cognitifs
Mutian Yang, Jiandong Gao, Ji Wu
il y a 23 jours

Réf. : Form -- Réduction des prioris humains dans la vérification formelle logicielle évitable avec le renforcement par apprentissage dans les modèles de langage à grande échelle : Une étude préliminaire sur Dafny
Chuanhao Yan, Fengdi Che, Xuhan Huang, et al.
il y a 23 jours

RAVine : Évaluation alignée sur la réalité pour la recherche agente
Yilong Xu, Xiang Long, Zhi Zheng, et al.
il y a 23 jours

Peut un domaine aider les autres ? Une étude centrée sur les données sur le raisonnement multi-domaines par apprentissage par renforcement
Yu Li, Zhuoshi Pan, Honglin Lin, et al.
il y a 23 jours

DesignLab : Conception de diapositives par détection et correction itératives
Jooyeol Yun, Heng Wang, Yotaro Shimose, et al.
il y a 23 jours

Yume : Un modèle de génération de monde interactif
Xiaofeng Mao, Shaoheng Lin, Zhen Li, et al.
il y a 23 jours

Pixels, Motifs, mais pas de Poésie : Voir le Monde comme les Humains
Hongcheng Gao, Zihao Huang, Lin Xu, et al.
il y a 23 jours

Construction d'un MLLM ophtalmique pour la collaboration diagnostic-positionnelle par le raisonnement en chaîne cognitive clinique
Xinyao Liu, Diping Song
il y a 24 jours

HySafe-AI : Cadre d'analyse architectural de sécurité hybride pour les systèmes d'intelligence artificielle : Une étude de cas
Mandar Pitale, Jelena Frtunikj, Abhinaw Priyadershi, et al.
il y a 24 jours

Zebra-CoT : Un jeu de données pour le raisonnement multimodal vision-langage intercalé
Ang Li, Charles Wang, Kaiyu Yue, et al.
il y a 24 jours

Apprentissage par renforcement semi-off-policy pour le raisonnement lent vision-langage
Junhao Shen, Haiteng Zhao, Yuzhe Gu, et al.
il y a 24 jours

Suréchantillonner ce qui compte : un échantillonnage latent adaptatif par région pour des transformateurs de diffusion accélérés
Wongi Jeong, Kyungryeol Lee, Hoigi Seo, et al.
il y a 24 jours

MegaScience : Pousser les limites des jeux de données post-entraînement pour le raisonnement scientifique
Run-Ze Fan, Zengzhi Wang, Pengfei Liu
il y a 24 jours

Rapport technique Step-Audio 2
Boyong Wu, Chao Yan, Chen Hu, et al.
il y a 24 jours

Au-delà des limites du contexte : Fils subconscients pour un raisonnement à long terme
Hongyin Luo, Nathaniel Morgan, Tina Li, et al.
il y a 24 jours

Cadre de gestion des risques liés à l'intelligence artificielle de pointe en pratique : Rapport technique d'analyse des risques
Xiaoyang Chen, Yunhao Chen, Zeren Chen, et al.
il y a 25 jours

Transformateurs de connaissances conscients de l'incertitude pour le commerce d'énergie pair à pair avec l'apprentissage par renforcement multi-agents
Mian Ibad Ali Shah, Enda Barrett, Karl Mason
il y a 25 jours

Pas d'humains nécessaires : Recherche de triplets d'édition d'images autonome de haute qualité
Maksim Kuprashevich, Grigorii Alekseenko, Irina Tolstykh, et al.
il y a 25 jours

Édition de niveau de pièce 3D robuste dans le recouvrement 3D Gaussien avec l'échantillonnage distillé des scores régularisés
Hayeon Kim, Ji Ha Jang, Se Young Chun
il y a 25 jours

WebShaper : Synthèse de données agissante par formalisation de la recherche d'information
Zhengwei Tao, Jialong Wu, Wenbiao Yin, et al.
il y a 25 jours

L'Attelage invisible : pourquoi le RLVR ne peut-il pas s'échapper de son origine
Fang Wu, Weihao Xuan, Ximing Lu, et al.
il y a 25 jours

GUI-G^2 : Modélisation de récompense gaussienne pour l'ancrage de l'interface graphique utilisateur
Fei Tang, Zhangxuan Gu, Zhengxi Lu, et al.
il y a 25 jours

MiroMind-M1 : Une avancée en raisonnement mathématique via l'optimisation multi-étapes de politique contextuelle
Xingxuan Li, Yao Xiao, Dianwen Ng, et al.
il y a 25 jours

Conception de protéines liant des régions désordonnées intrinsèquement
Kejia Wu, et al
il y a un mois

Un Modèle Génératif à Tous les Atomes pour la Conception de Complexes Protéiques
Ruizhe Chen, Dongyu Xue, Xiangxin Zhou, et al.
il y a un mois

RedOne : Révélation de l'entraînement post-formation spécifique au domaine dans les services de réseautage social
Fei Zhao, Chonggang Lu, Yue Wang, et al.
il y a un mois

CSD-VAR : Décomposition du contenu et du style dans les modèles autorégressifs visuels
Quang-Binh Nguyen, Minh Luu, Quang Nguyen, et al.
il y a un mois