HyperAI

Principal

GPU

Console
Studio
Docs
Tarifs

Pulse

Actualités

Ressources

Publications de recherche
Notebooks
Jeux de données
Wiki

Benchmarks

SOTA
Modèles LLM
Classement des GPU

Communauté

Événements

Utilitaires

À propos Conditions d’utilisation Politique de confidentialité
Français

Command Palette

Search for a command to run...

HyperAI
Papers

Papers

Articles de recherche en IA de pointe mis à jour quotidiennement pour vous aider à suivre les dernières tendances en IA

Construire l’avenir de l’intelligence artificielle

À propos

À propos Support Aide relative au jeu de données

Produits

Actualités Publications de recherche Notebooks Jeux de données Wiki

Liens

© HyperAI

GitHub Discord X (formerly Twitter)

HyperAI

Principal

GPU

Console
Studio
Docs
Tarifs

Pulse

Actualités

Ressources

Publications de recherche
Notebooks
Jeux de données
Wiki

Benchmarks

SOTA
Modèles LLM
Classement des GPU

Communauté

Événements

Utilitaires

À propos Conditions d’utilisation Politique de confidentialité
Français

Command Palette

Search for a command to run...

HyperAI
Papers

Papers

Articles de recherche en IA de pointe mis à jour quotidiennement pour vous aider à suivre les dernières tendances en IA

Construire l’avenir de l’intelligence artificielle

À propos

À propos Support Aide relative au jeu de données

Produits

Actualités Publications de recherche Notebooks Jeux de données Wiki

Liens

© HyperAI

GitHub Discord X (formerly Twitter)

MAKIEVAL : Un cadre automatique multilingue basé sur WiKIdata pour l'évaluation de la sensibilisation culturelle des LLMs

MAKIEVAL : Un cadre automatique multilingue basé sur WiKIdata pour l'évaluation de la sensibilisation culturelle des LLMs

Génération De Texte

Raoyuan Zhao, Beiduo Chen, Barbara Plank, et al.

GeneralVLA-2 : Reconstruction consciente de la géométrie et mémoire gouvernée pour la planification robotique

GeneralVLA-2 : Reconstruction consciente de la géométrie et mémoire gouvernée pour la planification robotique

Vision Machine 3D

Génération Augmentée Par La Recherche

Haoyu Wang, Guoqing Ma, Zeyu Zhang, et al.

Masquage Réflexif Multi-Tour Élicite le Raisonnement dans les Modèles de Diffusion par Masquage

Modèle De Diffusion

Génération De Texte

Yanming Zhang, Yihan Bian, Jingyuan Qi, et al.

BrainG3N : Un Tokeniseur à Double Usage pour la Génération Contrôlée d'IRM Cérébrales 3D

Modèle De Diffusion

Génération 3D

Max Van Puyvelde, Ibrahim Gulluk, Wim Van Criekinge, et al.

GateMem : Évaluation de la gouvernance de la mémoire dans les Agents à mémoire partagée Multi-Principal

Zhe Ren, Yibo Yang, Yimeng Chen, et al.

MemSlides : Un cadre d'agent hiérarchique piloté par la mémoire pour la génération de diapositives personnalisée avec révision locale multi-tours

Ye Jin, Yangyang Xu, Jun Zhu, et al.

PerceptionDLM : Perception parallèle de régions avec des modèles de langage de diffusion multimodaux

Modèle De Diffusion

Décrivain D'image

Yueyi Sun, Yuhao Wang, Jason Li, et al.

Modèles mondiaux du code pour le jeu généraliste de jeux

Génération De Code

Wolfgang Lehrach, Daniel Hennes, Miguel Lázaro-Gredilla, et al.

Au-delà des classements statiques : validité prédictive pour l'évaluation des agents LLM

Dhaval C. Patel, Kaoutar El Maghraoui, Shuxin Lin, et al.

S-Agent : Utilisation d'outils spatiaux élicite le raisonnement pour l'intelligence spatiale

Compréhension Vidéo

Yalun Dai, Hao Li, Shulin Tian, et al.

Multi-LCB : Extension de LiveCodeBench à plusieurs langages de programmation

Génération De Code

Maria Ivanova, Pavel Zadorozhny, Rodion Levichev, et al.

Apprentissage Robotique Agentic Ludique

Génération De Code

Junyi Zhang, Jiaxin Ge, Hanjun Yoo, et al.

DragMesh-2 : Interaction main-objet adroite physiquement plausible avec des objets articulés

Tianshan Zhang, Yijia Duan, Yanjun Li, et al.

Moebius : cadre léger d'inpainting d'images de 0.2B avec des performances de niveau 10B

Inpainting D'image

Modèle De Diffusion

Kangsheng Duan, Ziyang Xu, Wenyu Liu, et al.

EfficientRollout : Décodage auto-spéculatif conscient du système pour les rollouts RL

Apprentissage Par Renforcement

Minseo Kim, Minjae Lee, Seunghyuk Oh, et al.

Faites confiance au bon enseignant : Auto-distillation consciente de la qualité pour l'ancrage GUI

Jingyuan Huang, Zuming Huang, Yucheng Shi, et al.

Renforcement du raisonnement à double voie dans les modèles de langage visuel spatiaux

Vision Machine 3D

Yatai Ji, An-Chieh Cheng, Yang Fu, et al.

Les interventions SAE sont peu fiables : Récupération post-intervention des comportements supprimés

Apprentissage Profond

Mingyue Cui, Linghui Shen, Xingyi Yang

Kairos: Une pile de modèles du monde native pour l'IA physique

Kairos Team, Fei Wang, Shan You, et al.

Guava : Un harnais efficace et universel pour la manipulation incarnée

Intelligence Incarnée

Haowen Liu, Xirui Li, Shaoxiong Yao, et al.

Au-delà de l'observation actuelle : Évaluation des grands modèles de langage multimodaux dans les jeux non-markoviens contrôlables

Shengyuan Ding, Xilin Wei, Xinyu Fang, et al.

LifeSciBench : Évaluer les Language Models sur des tâches réalistes et de niveau expert en sciences de la vie

Amelia Liu, Andrew Ho, Anne Marie Droste, et al.

TRIAGE : Raisonnement dialectique pour la prédiction de risque explicable sur des séries temporelles médicales à échantillonnage irrégulier avec des LLM

Entraînement Du Modèle

Hyeongwon Jang, Gyouk Chu, Changhun Kim, et al.

LectūraAgents : Un cadre Multi-Agent pour l'apprentissage personnalisé adaptatif assisté par IA et l'enseignement incarné

Intelligence Incarnée

Jaward Sesay, Yue Yu, Siwei Dong, et al.

GameCraft-Bench : Les Agents peuvent-ils construire des jeux jouables de bout en bout dans un moteur de jeu réel ?

Génération De Code

Tongxu Luo, Rongsheng Wang, Jiaxi Bi, et al.

Zone d'optimisation de la politique proximale : enseignant dans les invites, pas dans les gradients

Apprentissage Par Renforcement

Byung-Kwan Lee, Ximing Lu, Shizhe Diao, et al.

ACE-Ego-0 : Unification des données egocentriques humaines et robotiques pour le pré-entraînement VLA

Affinage Supervisé

Hao Li, Ganlong Zhao, Yufei Liu, et al.

LoopCoder-v2 : Ne boucler qu'une seule fois pour une mise à l'échelle efficace du calcul en phase de test

Génération De Code

Jian Yang, Shawn Guo, Wei Zhang, et al.

Prédire la sécurité des LLM avant leur mise en service grâce à la simulation du déploiement

Génération De Texte

Marcus Williams, Hannah Sheahan, Cameron Raymond, et al.

FastContext : Entraînement d'un Explorateur de Dépôt Efficace pour les Agents de Codage

Génération De Code

Shaoqiu Zhang, Maoquan Wang, Yuling Shi, et al.

VibeThinker-3B : Explorer la frontière du raisonnement vérifiable dans les petits modèles de langage

Affinage Supervisé

Sen Xu, Shixi Liu, Wei Wang, et al.

DreamX-World 1.0 : Un modèle du monde interactif à usage général

Modèle De Diffusion

Texte Vers Vidéo

DreamX Team, Yancheng Bai, Rui Chen, et al.

MAKIEVAL : Un cadre automatique multilingue basé sur WiKIdata pour l'évaluation de la sensibilisation culturelle des LLMs

MAKIEVAL : Un cadre automatique multilingue basé sur WiKIdata pour l'évaluation de la sensibilisation culturelle des LLMs

Génération De Texte

Raoyuan Zhao, Beiduo Chen, Barbara Plank, et al.

GeneralVLA-2 : Reconstruction consciente de la géométrie et mémoire gouvernée pour la planification robotique

GeneralVLA-2 : Reconstruction consciente de la géométrie et mémoire gouvernée pour la planification robotique

Vision Machine 3D

Génération Augmentée Par La Recherche

Haoyu Wang, Guoqing Ma, Zeyu Zhang, et al.

Masquage Réflexif Multi-Tour Élicite le Raisonnement dans les Modèles de Diffusion par Masquage

Modèle De Diffusion

Génération De Texte

Yanming Zhang, Yihan Bian, Jingyuan Qi, et al.

BrainG3N : Un Tokeniseur à Double Usage pour la Génération Contrôlée d'IRM Cérébrales 3D

Modèle De Diffusion

Génération 3D

Max Van Puyvelde, Ibrahim Gulluk, Wim Van Criekinge, et al.

GateMem : Évaluation de la gouvernance de la mémoire dans les Agents à mémoire partagée Multi-Principal

Zhe Ren, Yibo Yang, Yimeng Chen, et al.

MemSlides : Un cadre d'agent hiérarchique piloté par la mémoire pour la génération de diapositives personnalisée avec révision locale multi-tours

Ye Jin, Yangyang Xu, Jun Zhu, et al.

PerceptionDLM : Perception parallèle de régions avec des modèles de langage de diffusion multimodaux

Modèle De Diffusion

Décrivain D'image

Yueyi Sun, Yuhao Wang, Jason Li, et al.

Modèles mondiaux du code pour le jeu généraliste de jeux

Génération De Code

Wolfgang Lehrach, Daniel Hennes, Miguel Lázaro-Gredilla, et al.

Au-delà des classements statiques : validité prédictive pour l'évaluation des agents LLM

Dhaval C. Patel, Kaoutar El Maghraoui, Shuxin Lin, et al.

S-Agent : Utilisation d'outils spatiaux élicite le raisonnement pour l'intelligence spatiale

Compréhension Vidéo

Yalun Dai, Hao Li, Shulin Tian, et al.

Multi-LCB : Extension de LiveCodeBench à plusieurs langages de programmation

Génération De Code

Maria Ivanova, Pavel Zadorozhny, Rodion Levichev, et al.

Apprentissage Robotique Agentic Ludique

Génération De Code

Junyi Zhang, Jiaxin Ge, Hanjun Yoo, et al.

DragMesh-2 : Interaction main-objet adroite physiquement plausible avec des objets articulés

Tianshan Zhang, Yijia Duan, Yanjun Li, et al.

Moebius : cadre léger d'inpainting d'images de 0.2B avec des performances de niveau 10B

Inpainting D'image

Modèle De Diffusion

Kangsheng Duan, Ziyang Xu, Wenyu Liu, et al.

EfficientRollout : Décodage auto-spéculatif conscient du système pour les rollouts RL

Apprentissage Par Renforcement

Minseo Kim, Minjae Lee, Seunghyuk Oh, et al.

Faites confiance au bon enseignant : Auto-distillation consciente de la qualité pour l'ancrage GUI

Jingyuan Huang, Zuming Huang, Yucheng Shi, et al.

Renforcement du raisonnement à double voie dans les modèles de langage visuel spatiaux

Vision Machine 3D

Yatai Ji, An-Chieh Cheng, Yang Fu, et al.

Les interventions SAE sont peu fiables : Récupération post-intervention des comportements supprimés

Apprentissage Profond

Mingyue Cui, Linghui Shen, Xingyi Yang

Kairos: Une pile de modèles du monde native pour l'IA physique

Kairos Team, Fei Wang, Shan You, et al.

Guava : Un harnais efficace et universel pour la manipulation incarnée

Intelligence Incarnée

Haowen Liu, Xirui Li, Shaoxiong Yao, et al.

Au-delà de l'observation actuelle : Évaluation des grands modèles de langage multimodaux dans les jeux non-markoviens contrôlables

Shengyuan Ding, Xilin Wei, Xinyu Fang, et al.

LifeSciBench : Évaluer les Language Models sur des tâches réalistes et de niveau expert en sciences de la vie

Amelia Liu, Andrew Ho, Anne Marie Droste, et al.

TRIAGE : Raisonnement dialectique pour la prédiction de risque explicable sur des séries temporelles médicales à échantillonnage irrégulier avec des LLM

Entraînement Du Modèle

Hyeongwon Jang, Gyouk Chu, Changhun Kim, et al.

LectūraAgents : Un cadre Multi-Agent pour l'apprentissage personnalisé adaptatif assisté par IA et l'enseignement incarné

Intelligence Incarnée

Jaward Sesay, Yue Yu, Siwei Dong, et al.

GameCraft-Bench : Les Agents peuvent-ils construire des jeux jouables de bout en bout dans un moteur de jeu réel ?

Génération De Code

Tongxu Luo, Rongsheng Wang, Jiaxi Bi, et al.

Zone d'optimisation de la politique proximale : enseignant dans les invites, pas dans les gradients

Apprentissage Par Renforcement

Byung-Kwan Lee, Ximing Lu, Shizhe Diao, et al.

ACE-Ego-0 : Unification des données egocentriques humaines et robotiques pour le pré-entraînement VLA

Affinage Supervisé

Hao Li, Ganlong Zhao, Yufei Liu, et al.

LoopCoder-v2 : Ne boucler qu'une seule fois pour une mise à l'échelle efficace du calcul en phase de test

Génération De Code

Jian Yang, Shawn Guo, Wei Zhang, et al.

Prédire la sécurité des LLM avant leur mise en service grâce à la simulation du déploiement

Génération De Texte

Marcus Williams, Hannah Sheahan, Cameron Raymond, et al.

FastContext : Entraînement d'un Explorateur de Dépôt Efficace pour les Agents de Codage

Génération De Code

Shaoqiu Zhang, Maoquan Wang, Yuling Shi, et al.

VibeThinker-3B : Explorer la frontière du raisonnement vérifiable dans les petits modèles de langage

Affinage Supervisé

Sen Xu, Shixi Liu, Wei Wang, et al.

DreamX-World 1.0 : Un modèle du monde interactif à usage général

Modèle De Diffusion

Texte Vers Vidéo

DreamX Team, Yancheng Bai, Rui Chen, et al.

Masquage Réflexif Multi-Tour Élicite le Raisonnement dans les Modèles de Diffusion par Masquage

BrainG3N : Un Tokeniseur à Double Usage pour la Génération Contrôlée d'IRM Cérébrales 3D

GateMem : Évaluation de la gouvernance de la mémoire dans les Agents à mémoire partagée Multi-Principal

MemSlides : Un cadre d'agent hiérarchique piloté par la mémoire pour la génération de diapositives personnalisée avec révision locale multi-tours

PerceptionDLM : Perception parallèle de régions avec des modèles de langage de diffusion multimodaux

Modèles mondiaux du code pour le jeu généraliste de jeux

Au-delà des classements statiques : validité prédictive pour l'évaluation des agents LLM

S-Agent : Utilisation d'outils spatiaux élicite le raisonnement pour l'intelligence spatiale

Multi-LCB : Extension de LiveCodeBench à plusieurs langages de programmation

Apprentissage Robotique Agentic Ludique

DragMesh-2 : Interaction main-objet adroite physiquement plausible avec des objets articulés

Moebius : cadre léger d'inpainting d'images de 0.2B avec des performances de niveau 10B

EfficientRollout : Décodage auto-spéculatif conscient du système pour les rollouts RL

Faites confiance au bon enseignant : Auto-distillation consciente de la qualité pour l'ancrage GUI

Renforcement du raisonnement à double voie dans les modèles de langage visuel spatiaux

Les interventions SAE sont peu fiables : Récupération post-intervention des comportements supprimés

Kairos: Une pile de modèles du monde native pour l'IA physique

Guava : Un harnais efficace et universel pour la manipulation incarnée

Au-delà de l'observation actuelle : Évaluation des grands modèles de langage multimodaux dans les jeux non-markoviens contrôlables

LifeSciBench : Évaluer les Language Models sur des tâches réalistes et de niveau expert en sciences de la vie

TRIAGE : Raisonnement dialectique pour la prédiction de risque explicable sur des séries temporelles médicales à échantillonnage irrégulier avec des LLM

LectūraAgents : Un cadre Multi-Agent pour l'apprentissage personnalisé adaptatif assisté par IA et l'enseignement incarné

GameCraft-Bench : Les Agents peuvent-ils construire des jeux jouables de bout en bout dans un moteur de jeu réel ?

Zone d'optimisation de la politique proximale : enseignant dans les invites, pas dans les gradients

ACE-Ego-0 : Unification des données egocentriques humaines et robotiques pour le pré-entraînement VLA

LoopCoder-v2 : Ne boucler qu'une seule fois pour une mise à l'échelle efficace du calcul en phase de test

Prédire la sécurité des LLM avant leur mise en service grâce à la simulation du déploiement

FastContext : Entraînement d'un Explorateur de Dépôt Efficace pour les Agents de Codage

VibeThinker-3B : Explorer la frontière du raisonnement vérifiable dans les petits modèles de langage

DreamX-World 1.0 : Un modèle du monde interactif à usage général

Masquage Réflexif Multi-Tour Élicite le Raisonnement dans les Modèles de Diffusion par Masquage

BrainG3N : Un Tokeniseur à Double Usage pour la Génération Contrôlée d'IRM Cérébrales 3D

GateMem : Évaluation de la gouvernance de la mémoire dans les Agents à mémoire partagée Multi-Principal

MemSlides : Un cadre d'agent hiérarchique piloté par la mémoire pour la génération de diapositives personnalisée avec révision locale multi-tours

PerceptionDLM : Perception parallèle de régions avec des modèles de langage de diffusion multimodaux

Modèles mondiaux du code pour le jeu généraliste de jeux

Au-delà des classements statiques : validité prédictive pour l'évaluation des agents LLM

S-Agent : Utilisation d'outils spatiaux élicite le raisonnement pour l'intelligence spatiale

Multi-LCB : Extension de LiveCodeBench à plusieurs langages de programmation

Apprentissage Robotique Agentic Ludique

DragMesh-2 : Interaction main-objet adroite physiquement plausible avec des objets articulés

Moebius : cadre léger d'inpainting d'images de 0.2B avec des performances de niveau 10B

EfficientRollout : Décodage auto-spéculatif conscient du système pour les rollouts RL

Faites confiance au bon enseignant : Auto-distillation consciente de la qualité pour l'ancrage GUI

Renforcement du raisonnement à double voie dans les modèles de langage visuel spatiaux

Les interventions SAE sont peu fiables : Récupération post-intervention des comportements supprimés

Kairos: Une pile de modèles du monde native pour l'IA physique

Guava : Un harnais efficace et universel pour la manipulation incarnée

Au-delà de l'observation actuelle : Évaluation des grands modèles de langage multimodaux dans les jeux non-markoviens contrôlables

LifeSciBench : Évaluer les Language Models sur des tâches réalistes et de niveau expert en sciences de la vie

TRIAGE : Raisonnement dialectique pour la prédiction de risque explicable sur des séries temporelles médicales à échantillonnage irrégulier avec des LLM

LectūraAgents : Un cadre Multi-Agent pour l'apprentissage personnalisé adaptatif assisté par IA et l'enseignement incarné

GameCraft-Bench : Les Agents peuvent-ils construire des jeux jouables de bout en bout dans un moteur de jeu réel ?

Zone d'optimisation de la politique proximale : enseignant dans les invites, pas dans les gradients

ACE-Ego-0 : Unification des données egocentriques humaines et robotiques pour le pré-entraînement VLA

LoopCoder-v2 : Ne boucler qu'une seule fois pour une mise à l'échelle efficace du calcul en phase de test

Prédire la sécurité des LLM avant leur mise en service grâce à la simulation du déploiement

FastContext : Entraînement d'un Explorateur de Dépôt Efficace pour les Agents de Codage

VibeThinker-3B : Explorer la frontière du raisonnement vérifiable dans les petits modèles de langage

DreamX-World 1.0 : Un modèle du monde interactif à usage général