HyperAIHyperAI

Articles de recherche récents

Articles de recherche sur l'IA mis à jour quotidiennement pour vous aider à suivre les dernières tendances en matière d'IA

BANG : Division de ressources 3D par dynamique éclatée générative
BANG : Division de ressources 3D par dynamique éclatée générative
Longwen Zhang, Qixuan Zhang, Haoran Jiang, et al.
il y a 17 jours
ScreenCoder : Progresser dans la génération visuelle vers le code pour l'automatisation du front-end grâce à des agents multimodaux modulaires
ScreenCoder : Progresser dans la génération visuelle vers le code pour l'automatisation du front-end grâce à des agents multimodaux modulaires
Yilei Jiang, Yaozhi Zheng, Yuxuan Wan, et al.
il y a 17 jours
MIRepNet : Une chaîne de traitement et un modèle fondamental pour la classification de l’imagerie motrice à partir d’EEG
MIRepNet : Une chaîne de traitement et un modèle fondamental pour la classification de l’imagerie motrice à partir d’EEG
Dingkun Liu, Zhu Chen, Jingwei Luo, et al.
il y a 17 jours
ChemDFM-R : Un raisonneur chimique basé sur un modèle linguistique grand (LLM) amélioré par des connaissances chimiques atomisées
ChemDFM-R : Un raisonneur chimique basé sur un modèle linguistique grand (LLM) amélioré par des connaissances chimiques atomisées
Zihan Zhao, Bo Chen, Ziping Wan, et al.
il y a 17 jours
X-Omni : Le apprentissage par renforcement rend aux modèles de génération d’images autoregressifs discrets leur grandeur d’antan
X-Omni : Le apprentissage par renforcement rend aux modèles de génération d’images autoregressifs discrets leur grandeur d’antan
Zigang Geng, Yibing Wang, Yeyao Ma, et al.
il y a 17 jours
HunyuanWorld 1.0 : Génération de mondes 3D immersifs, explorables et interactifs à partir de mots ou de pixels
HunyuanWorld 1.0 : Génération de mondes 3D immersifs, explorables et interactifs à partir de mots ou de pixels
HunyuanWorld Team, Zhenwei Wang, Yuhao Liu, et al.
il y a 17 jours
AlphaEarth Foundations : un modèle de champ d'embeddings pour une cartographie globale précise et efficace à partir de données étiquetées éparses
AlphaEarth Foundations : un modèle de champ d'embeddings pour une cartographie globale précise et efficace à partir de données étiquetées éparses
Christopher F. Brown, Michal R. Kazmierski, Valerie J. Pasquarella, et al.
il y a 17 jours
Vers une prévision à longue portée de l'ENSO à l'aide d'un modèle d'apprentissage profond explicite
Vers une prévision à longue portée de l'ENSO à l'aide d'un modèle d'apprentissage profond explicite
Qi Chen, Yinghao Cui, Guobin Hong, et al.
il y a 17 jours
OmniArch : Construction d'un modèle fondamental pour le calcul scientifique
OmniArch : Construction d'un modèle fondamental pour le calcul scientifique
Tianyu Chen, Haoyi Zhou, Ying Li, et al.
il y a 17 jours
UI-AGILE : Approfondir les agents d'interface utilisateur avec un apprentissage par renforcement efficace et une ancrage précis au moment de l'inférence
UI-AGILE : Approfondir les agents d'interface utilisateur avec un apprentissage par renforcement efficace et une ancrage précis au moment de l'inférence
Shuquan Lian, Yuhang Wu, Jia Ma, et al.
il y a 18 jours
DualSG : Un cadre de prévision des séries temporelles multivariées à guide sémantique explicite à deux flux
DualSG : Un cadre de prévision des séries temporelles multivariées à guide sémantique explicite à deux flux
Kuiye Ding, Fanda Fan, Yao Wang, et al.
il y a 18 jours
Lorsque les tokens parlent trop : Une revue de la compression de tokens à longue portée multimodaux dans les images, vidéos et audios
Lorsque les tokens parlent trop : Une revue de la compression de tokens à longue portée multimodaux dans les images, vidéos et audios
Kele Shao, Keda Tao, Kejia Zhang, et al.
il y a 19 jours
SmallThinker : Une famille de modèles de langage à grande échelle efficaces entraînés nativement pour le déploiement local
SmallThinker : Une famille de modèles de langage à grande échelle efficaces entraînés nativement pour le déploiement local
Yixin Song, Zhenliang Xue, Dongliang Wei, et al.
il y a 19 jours
Reconstruction de l'intelligence spatiale 4D : Un état de l'art
Reconstruction de l'intelligence spatiale 4D : Un état de l'art
Yukang Cao, Jiahao Lu, Zhisheng Huang, et al.
il y a 19 jours
Rep-MTL : Déverrouiller le pouvoir de la salience des tâches au niveau de la représentation pour l'apprentissage multi-tâches
Rep-MTL : Déverrouiller le pouvoir de la salience des tâches au niveau de la représentation pour l'apprentissage multi-tâches
Zedong Wang, Siyuan Li, Dan Xu
il y a 19 jours
ARC-Hunyuan-Video-7B : Compréhension structurée des vidéos du monde réel en courte durée
ARC-Hunyuan-Video-7B : Compréhension structurée des vidéos du monde réel en courte durée
Yuying Ge, Yixiao Ge, Chen Li, et al.
il y a 19 jours
Optimisation de politique renforcée agente
Optimisation de politique renforcée agente
Guanting Dong, Hangyu Mao, Kai Ma, et al.
il y a 19 jours
Une revue des agents auto-évoluants : Vers une intelligence artificielle superieure
Une revue des agents auto-évoluants : Vers une intelligence artificielle superieure
Huan-ang Gao, Jiayi Geng, Wenyue Hua, et al.
il y a 19 jours
Spécification de correction auto : atténuer le piratage de récompense en contexte par une révision au moment des tests
Spécification de correction auto : atténuer le piratage de récompense en contexte par une révision au moment des tests
V\u00edctor Gallego
il y a 20 jours
PRIX : Apprendre à planifier à partir de pixels bruts pour le pilotage autonome en boucle complète
PRIX : Apprendre à planifier à partir de pixels bruts pour le pilotage autonome en boucle complète
Maciej K. Wozniak, Lianhang Liu, Yixi Cai, et al.
il y a 20 jours
Chat avec l'IA : La tournure surprenante de la communication vidéo en temps réel passant d'un humain à une IA
Chat avec l'IA : La tournure surprenante de la communication vidéo en temps réel passant d'un humain à une IA
Jiangkai Wu, Zhiyuan Ren, Liming Liu, et al.
il y a 20 jours
MMBench-GUI : Cadre d'évaluation hiérarchique pour les agents GUI multiplateformes
MMBench-GUI : Cadre d'évaluation hiérarchique pour les agents GUI multiplateformes
Xuehui Wang, Zhenyu Wu, JingJing Xie, et al.
il y a 20 jours
Recherche profonde avec diffusion en temps de test
Recherche profonde avec diffusion en temps de test
Rujun Han, Yanfei Chen, Zoey CuiZhu, et al.
il y a 20 jours
La géométrie de la quantification des LLM : GPTQ comme l'algorithme du plan le plus proche de Babai
La géométrie de la quantification des LLM : GPTQ comme l'algorithme du plan le plus proche de Babai
Jiale Chen, Torsten Hoefler, Dan Alistarh
il y a 20 jours
MedIQA : Un modèle fondamental évolutif pour l'évaluation de la qualité des images médicales basée sur les prompts
MedIQA : Un modèle fondamental évolutif pour l'évaluation de la qualité des images médicales basée sur les prompts
Siyi Xun, Yue Sun, Jingkun Chen, et al.
il y a 20 jours
OS-MAP : Jusqu'où peuvent aller les agents utilisant l'ordinateur en termes de largeur et de profondeur ?
OS-MAP : Jusqu'où peuvent aller les agents utilisant l'ordinateur en termes de largeur et de profondeur ?
Xuetian Chen, Yinghao Chen, Xinfeng Yuan, et al.
il y a 20 jours
Optimisation de la politique budgétaire hiérarchique pour le raisonnement adaptatif
Optimisation de la politique budgétaire hiérarchique pour le raisonnement adaptatif
Shangke Lyu, Linjuan Wu, Yuchen Yan, et al.
il y a 21 jours
Captain Cinema : Vers la génération de courts métrages
Captain Cinema : Vers la génération de courts métrages
Junfei Xiao, Ceyuan Yang, Lvmin Zhang, et al.
il y a 21 jours
LAPO : L'optimisation adaptative de la politique par l'intégration de l'efficacité du raisonnement
LAPO : L'optimisation adaptative de la politique par l'intégration de l'efficacité du raisonnement
Xingyu Wu, Yuchen Yan, Shangke Lyu, et al.
il y a 21 jours
MUR : Raisonnement guidé par l'incertitude de la quantité de mouvement pour les grands modèles linguistiques
MUR : Raisonnement guidé par l'incertitude de la quantité de mouvement pour les grands modèles linguistiques
Hang Yan, Fangzhi Xu, Rongman Xu, et al.
il y a 21 jours