HyperAIHyperAI

Articles de recherche récents

Articles de recherche sur l'IA mis à jour quotidiennement pour vous aider à suivre les dernières tendances en matière d'IA

∇NABLA : Attention Adaptative par Bloc aux Voisinages
∇NABLA : Attention Adaptative par Bloc aux Voisinages
Dmitrii Mikhailov, Aleksey Letunovskiy, Maria Kovaleva, et al.
il y a 20 jours
Optimisation de la politique des séquences de groupe
Optimisation de la politique des séquences de groupe
Chujie Zheng, Shixuan Liu, Mingze Li, et al.
il y a 20 jours
SafeWork-R1 : Coévolution de la sécurité et de l'intelligence en vertu de la loi AI-45
SafeWork-R1 : Coévolution de la sécurité et de l'intelligence en vertu de la loi AI-45
Yicheng Bao, Guanxu Chen, Mingkang Chen, et al.
il y a 23 jours
Découpler la connaissance et le raisonnement dans les LLM : Une exploration basée sur la théorie des deux systèmes cognitifs
Découpler la connaissance et le raisonnement dans les LLM : Une exploration basée sur la théorie des deux systèmes cognitifs
Mutian Yang, Jiandong Gao, Ji Wu
il y a 23 jours
Réf. : Form -- Réduction des prioris humains dans la vérification formelle logicielle évitable avec le renforcement par apprentissage dans les modèles de langage à grande échelle : Une étude préliminaire sur Dafny
Réf. : Form -- Réduction des prioris humains dans la vérification formelle logicielle évitable avec le renforcement par apprentissage dans les modèles de langage à grande échelle : Une étude préliminaire sur Dafny
Chuanhao Yan, Fengdi Che, Xuhan Huang, et al.
il y a 23 jours
RAVine : Évaluation alignée sur la réalité pour la recherche agente
RAVine : Évaluation alignée sur la réalité pour la recherche agente
Yilong Xu, Xiang Long, Zhi Zheng, et al.
il y a 23 jours
Peut un domaine aider les autres ? Une étude centrée sur les données sur le raisonnement multi-domaines par apprentissage par renforcement
Peut un domaine aider les autres ? Une étude centrée sur les données sur le raisonnement multi-domaines par apprentissage par renforcement
Yu Li, Zhuoshi Pan, Honglin Lin, et al.
il y a 23 jours
DesignLab : Conception de diapositives par détection et correction itératives
DesignLab : Conception de diapositives par détection et correction itératives
Jooyeol Yun, Heng Wang, Yotaro Shimose, et al.
il y a 23 jours
Yume : Un modèle de génération de monde interactif
Yume : Un modèle de génération de monde interactif
Xiaofeng Mao, Shaoheng Lin, Zhen Li, et al.
il y a 23 jours
Pixels, Motifs, mais pas de Poésie : Voir le Monde comme les Humains
Pixels, Motifs, mais pas de Poésie : Voir le Monde comme les Humains
Hongcheng Gao, Zihao Huang, Lin Xu, et al.
il y a 23 jours
Construction d'un MLLM ophtalmique pour la collaboration diagnostic-positionnelle par le raisonnement en chaîne cognitive clinique
Construction d'un MLLM ophtalmique pour la collaboration diagnostic-positionnelle par le raisonnement en chaîne cognitive clinique
Xinyao Liu, Diping Song
il y a 24 jours
HySafe-AI : Cadre d'analyse architectural de sécurité hybride pour les systèmes d'intelligence artificielle : Une étude de cas
HySafe-AI : Cadre d'analyse architectural de sécurité hybride pour les systèmes d'intelligence artificielle : Une étude de cas
Mandar Pitale, Jelena Frtunikj, Abhinaw Priyadershi, et al.
il y a 24 jours
Zebra-CoT : Un jeu de données pour le raisonnement multimodal vision-langage intercalé
Zebra-CoT : Un jeu de données pour le raisonnement multimodal vision-langage intercalé
Ang Li, Charles Wang, Kaiyu Yue, et al.
il y a 24 jours
Apprentissage par renforcement semi-off-policy pour le raisonnement lent vision-langage
Apprentissage par renforcement semi-off-policy pour le raisonnement lent vision-langage
Junhao Shen, Haiteng Zhao, Yuzhe Gu, et al.
il y a 24 jours
Suréchantillonner ce qui compte : un échantillonnage latent adaptatif par région pour des transformateurs de diffusion accélérés
Suréchantillonner ce qui compte : un échantillonnage latent adaptatif par région pour des transformateurs de diffusion accélérés
Wongi Jeong, Kyungryeol Lee, Hoigi Seo, et al.
il y a 24 jours
MegaScience : Pousser les limites des jeux de données post-entraînement pour le raisonnement scientifique
MegaScience : Pousser les limites des jeux de données post-entraînement pour le raisonnement scientifique
Run-Ze Fan, Zengzhi Wang, Pengfei Liu
il y a 24 jours
Rapport technique Step-Audio 2
Rapport technique Step-Audio 2
Boyong Wu, Chao Yan, Chen Hu, et al.
il y a 24 jours
Au-delà des limites du contexte : Fils subconscients pour un raisonnement à long terme
Au-delà des limites du contexte : Fils subconscients pour un raisonnement à long terme
Hongyin Luo, Nathaniel Morgan, Tina Li, et al.
il y a 24 jours
Cadre de gestion des risques liés à l'intelligence artificielle de pointe en pratique : Rapport technique d'analyse des risques
Cadre de gestion des risques liés à l'intelligence artificielle de pointe en pratique : Rapport technique d'analyse des risques
Xiaoyang Chen, Yunhao Chen, Zeren Chen, et al.
il y a 25 jours
Transformateurs de connaissances conscients de l'incertitude pour le commerce d'énergie pair à pair avec l'apprentissage par renforcement multi-agents
Transformateurs de connaissances conscients de l'incertitude pour le commerce d'énergie pair à pair avec l'apprentissage par renforcement multi-agents
Mian Ibad Ali Shah, Enda Barrett, Karl Mason
il y a 25 jours
Pas d'humains nécessaires : Recherche de triplets d'édition d'images autonome de haute qualité
Pas d'humains nécessaires : Recherche de triplets d'édition d'images autonome de haute qualité
Maksim Kuprashevich, Grigorii Alekseenko, Irina Tolstykh, et al.
il y a 25 jours
Édition de niveau de pièce 3D robuste dans le recouvrement 3D Gaussien avec l'échantillonnage distillé des scores régularisés
Édition de niveau de pièce 3D robuste dans le recouvrement 3D Gaussien avec l'échantillonnage distillé des scores régularisés
Hayeon Kim, Ji Ha Jang, Se Young Chun
il y a 25 jours
WebShaper : Synthèse de données agissante par formalisation de la recherche d'information
WebShaper : Synthèse de données agissante par formalisation de la recherche d'information
Zhengwei Tao, Jialong Wu, Wenbiao Yin, et al.
il y a 25 jours
L'Attelage invisible : pourquoi le RLVR ne peut-il pas s'échapper de son origine
L'Attelage invisible : pourquoi le RLVR ne peut-il pas s'échapper de son origine
Fang Wu, Weihao Xuan, Ximing Lu, et al.
il y a 25 jours
GUI-G^2 : Modélisation de récompense gaussienne pour l'ancrage de l'interface graphique utilisateur
GUI-G^2 : Modélisation de récompense gaussienne pour l'ancrage de l'interface graphique utilisateur
Fei Tang, Zhangxuan Gu, Zhengxi Lu, et al.
il y a 25 jours
MiroMind-M1 : Une avancée en raisonnement mathématique via l'optimisation multi-étapes de politique contextuelle
MiroMind-M1 : Une avancée en raisonnement mathématique via l'optimisation multi-étapes de politique contextuelle
Xingxuan Li, Yao Xiao, Dianwen Ng, et al.
il y a 25 jours
Conception de protéines liant des régions désordonnées intrinsèquement
Conception de protéines liant des régions désordonnées intrinsèquement
Kejia Wu, et al
il y a un mois
Un Modèle Génératif à Tous les Atomes pour la Conception de Complexes Protéiques
Un Modèle Génératif à Tous les Atomes pour la Conception de Complexes Protéiques
Ruizhe Chen, Dongyu Xue, Xiangxin Zhou, et al.
il y a un mois
RedOne : Révélation de l'entraînement post-formation spécifique au domaine dans les services de réseautage social
RedOne : Révélation de l'entraînement post-formation spécifique au domaine dans les services de réseautage social
Fei Zhao, Chonggang Lu, Yue Wang, et al.
il y a un mois
CSD-VAR : Décomposition du contenu et du style dans les modèles autorégressifs visuels
CSD-VAR : Décomposition du contenu et du style dans les modèles autorégressifs visuels
Quang-Binh Nguyen, Minh Luu, Quang Nguyen, et al.
il y a un mois