HyperAIHyperAI

Articles de recherche récents

Articles de recherche sur l'IA mis à jour quotidiennement pour vous aider à suivre les dernières tendances en matière d'IA

CogDDN : Une Navigation Guidée par la Demande Cognitive avec Optimisation de la Décision et Pensée à Deux Processus
CogDDN : Une Navigation Guidée par la Demande Cognitive avec Optimisation de la Décision et Pensée à Deux Processus
Yuehao Huang, Liang Liu, Shuangming Lei, et al.
il y a un mois
LayerCake : Décodage contrastif sensible aux jetons au sein des couches de grands modèles linguistiques
LayerCake : Décodage contrastif sensible aux jetons au sein des couches de grands modèles linguistiques
Jingze Zhu, Yongliang Wu, Wenbo Zhu, et al.
il y a un mois
Mélange-de-Récursions : Apprentissage de Profondeurs Récursives Dynamiques pour le Calcul Adaptatif au Niveau des Tokens
Mélange-de-Récursions : Apprentissage de Profondeurs Récursives Dynamiques pour le Calcul Adaptatif au Niveau des Tokens
Sangmin Bae, Yujin Kim, Reza Bayat, et al.
il y a un mois
REST : Test de stress des grands modèles de raisonnement en posant plusieurs problèmes à la fois
REST : Test de stress des grands modèles de raisonnement en posant plusieurs problèmes à la fois
Zhuoshi Pan, Qizhi Pei, Yu Li, et al.
il y a un mois
EmbRACE-3K : Raisonnement et Action Corporels dans des Environnements Complexes
EmbRACE-3K : Raisonnement et Action Corporels dans des Environnements Complexes
Mingxian Lin, Wei Huang, Yitang Li, et al.
il y a un mois
Raisonnement ou Mémorisation ? Résultats Non Fiables de l'Apprentissage par Renforcement
En raison de la Contamination des Données
Raisonnement ou Mémorisation ? Résultats Non Fiables de l'Apprentissage par Renforcement En raison de la Contamination des Données
Mingqi Wu, Zhihao Zhang, Qiaole Dong, et al.
il y a un mois
SpeakerVid-5M : Un grand ensemble de données de haute qualité pour la génération d'interactions dyadiques audiovisuelles humaines
SpeakerVid-5M : Un grand ensemble de données de haute qualité pour la génération d'interactions dyadiques audiovisuelles humaines
Youliang Zhang, Zhaoyang Li, Duomin Wang, et al.
il y a un mois
VerifyBench : Un Benchmark Systématique pour Évaluer les Vérificateurs de Raisonnement dans Différents Domaines
VerifyBench : Un Benchmark Systématique pour Évaluer les Vérificateurs de Raisonnement dans Différents Domaines
Xuzhao Li, Xuchen Li, Shiyu Hu, et al.
il y a un mois
Conditionnement et modélisation des chaînes latérales pour la conception de séquences protéiques à atomes complets avec FAMPNN
Conditionnement et modélisation des chaînes latérales pour la conception de séquences protéiques à atomes complets avec FAMPNN
Talal Widatalla, Richard W. Shuai, Brian Hie, et al.
il y a un mois
Un Jeton pour Tromper les LLM en tant que Juge
Un Jeton pour Tromper les LLM en tant que Juge
Yulai Zhao, Haolin Liu, Dian Yu, et al.
il y a un mois
De l’un à plusieurs : Latents partiels contextuels pour la génération 3D
De l’un à plusieurs : Latents partiels contextuels pour la génération 3D
Shaocong Dong, Lihe Ding, Xiao Chen, et al.
il y a un mois
Open Vision Reasoner : Transfert du Comportement Cognitif Linguistique pour la Raisonnement Visuel
Open Vision Reasoner : Transfert du Comportement Cognitif Linguistique pour la Raisonnement Visuel
Yana Wei, Liang Zhao, Jianjian Sun, et al.
il y a un mois
Lumos-1 : Sur la Génération Vidéo Autoregressive à Partir d'une Perspective de Modèle Unifié
Lumos-1 : Sur la Génération Vidéo Autoregressive à Partir d'une Perspective de Modèle Unifié
Hangjie Yuan, Weihua Chen, Jun Cen, et al.
il y a un mois
Édition d'images pilotée par les neurones
Édition d'images pilotée par les neurones
Pengfei Zhou, Jie Xia, Xiaopeng Peng, et al.
il y a un mois
CLiFT : Tokens de Champ Lumineux Compressés pour un Rendu Neuronal Économique en Calcul et Adaptatif
CLiFT : Tokens de Champ Lumineux Compressés pour un Rendu Neuronal Économique en Calcul et Adaptatif
Zhengqing Wang, Yuefan Wu, Jiacheng Chen, et al.
il y a un mois
Modélisation et Optimisation des Systèmes de Systèmes : Un Cadre Intégré pour la Mobilité Intermodale
Modélisation et Optimisation des Systèmes de Systèmes : Un Cadre Intégré pour la Mobilité Intermodale
Paul Saves, Jasper Bussemaker, R\u00e9mi Lafage, et al.
il y a un mois
Transformateurs de diffusion à tous les atomes : Modélisation générative unifiée des molécules et des matériaux
Transformateurs de diffusion à tous les atomes : Modélisation générative unifiée des molécules et des matériaux
Chaitanya K. Joshi, Xiang Fu, Yi-Lun Liao, et al.
il y a un mois
OST-Bench : Évaluation des capacités des MLLMs dans la compréhension en ligne des scènes spatio-temporelles
OST-Bench : Évaluation des capacités des MLLMs dans la compréhension en ligne des scènes spatio-temporelles
JingLi Lin, Chenming Zhu, Runsen Xu, et al.
il y a un mois
Évaluation et Méthodologie du Raisonnement Visuel Ancré Basé sur des Preuves Traçables
Évaluation et Méthodologie du Raisonnement Visuel Ancré Basé sur des Preuves Traçables
Haochen Wang, Xiangtai Li, Zilong Huang, et al.
il y a un mois
MIRIX : Système de Mémoire Multi-Agents pour les Agents Basés sur les LLM
MIRIX : Système de Mémoire Multi-Agents pour les Agents Basés sur les LLM
Yu Wang, Xi Chen
il y a un mois
Rapport Technique Skywork-R1V3
Rapport Technique Skywork-R1V3
Wei Shen, Jiangbo Pei, Yi Peng, et al.
il y a un mois
T-LoRA : Personnalisation d'un modèle de diffusion à partir d'une seule image sans surapprentissage
T-LoRA : Personnalisation d'un modèle de diffusion à partir d'une seule image sans surapprentissage
Vera Soboleva, Aibek Alanov, Andrey Kuznetsov, et al.
il y a un mois
Étendre l'RL aux Vidéos Longues
Étendre l'RL aux Vidéos Longues
Yukang Chen, Wei Huang, Baifeng Shi, et al.
il y a un mois
Critiques des Modèles du Monde
Critiques des Modèles du Monde
Eric Xing, Mingkai Deng, Jinyu Hou, et al.
il y a un mois
Est-ce que la diversité suffit pour une manipulation robotique à grande échelle ?
Est-ce que la diversité suffit pour une manipulation robotique à grande échelle ?
Modi Shi, Li Chen, Jin Chen, et al.
il y a un mois
Nile-Chat : Modèles de langage égyptiens pour les scripts arabes et latins
Nile-Chat : Modèles de langage égyptiens pour les scripts arabes et latins
Guokan Shang, Hadi Abdine, Ahmad Chamma, et al.
il y a un mois
GTA1 : Agent d'Échelle pour les Tests en Temps Réel de l'Interface Utilisateur
GTA1 : Agent d'Échelle pour les Tests en Temps Réel de l'Interface Utilisateur
Yan Yang, Dongxu Li, Yutong Dai, et al.
il y a un mois
MedGen : Déverrouiller la Génération de Vidéos Médicales par le Scalage de Vidéos Médicales Annotées de Façon Granulaire
MedGen : Déverrouiller la Génération de Vidéos Médicales par le Scalage de Vidéos Médicales Annotées de Façon Granulaire
Rongsheng Wang, Junying Chen, Ke Ji, et al.
il y a un mois
RLVER : Apprentissage par renforcement avec des récompenses émotionnelles vérifiables pour les agents empathiques
RLVER : Apprentissage par renforcement avec des récompenses émotionnelles vérifiables pour les agents empathiques
Peisong Wang, Ruotian Ma, Bang Zhang, et al.
il y a un mois
L'Expérience Géo-Centrique de l'Utilisateur : Un Cadre Propulsé par les MLL pour une Planification Améliorée, une Navigation Optimisée et une Adaptation Dynamique
L'Expérience Géo-Centrique de l'Utilisateur : Un Cadre Propulsé par les MLL pour une Planification Améliorée, une Navigation Optimisée et une Adaptation Dynamique
Jieren Deng, Aleksandar Cvetkovic, Pak Kiu Chung, et al.
il y a un mois