HyperAI

Principal

GPU

Console
Docs
Tarifs

Pulse

Actualités

Ressources

Publications de recherche
Notebooks
Jeux de données
Wiki

Benchmarks

SOTA
Modèles LLM
Classement des GPU

Communauté

Événements

Utilitaires

À propos Conditions d’utilisation Politique de confidentialité
Français

Command Palette

Search for a command to run...

HyperAI
Papers

Papers

Articles de recherche en IA de pointe mis à jour quotidiennement pour vous aider à suivre les dernières tendances en IA

Construire l’avenir de l’intelligence artificielle

À propos

À propos Aide relative au jeu de données

Produits

Actualités Publications de recherche Notebooks Jeux de données Wiki

Liens

© HyperAI

GitHub Discord X (formerly Twitter)

HyperAI

Principal

GPU

Console
Docs
Tarifs

Pulse

Actualités

Ressources

Publications de recherche
Notebooks
Jeux de données
Wiki

Benchmarks

SOTA
Modèles LLM
Classement des GPU

Communauté

Événements

Utilitaires

À propos Conditions d’utilisation Politique de confidentialité
Français

Command Palette

Search for a command to run...

HyperAI
Papers

Papers

Articles de recherche en IA de pointe mis à jour quotidiennement pour vous aider à suivre les dernières tendances en IA

Construire l’avenir de l’intelligence artificielle

À propos

À propos Aide relative au jeu de données

Produits

Actualités Publications de recherche Notebooks Jeux de données Wiki

Liens

© HyperAI

GitHub Discord X (formerly Twitter)

TransitLM : un jeu de données et un benchmark à grande échelle pour la génération d'itinéraires de transport en commun sans carte

TransitLM : un jeu de données et un benchmark à grande échelle pour la génération d'itinéraires de transport en commun sans carte

Hanyu Guo, Jiedong Yang, Chao Chen, et al.

DelTA : Attribution discriminative de crédit de token pour l'apprentissage par renforcement à partir de récompenses vérifiables

DelTA : Attribution discriminative de crédit de token pour l'apprentissage par renforcement à partir de récompenses vérifiables

Apprentissage Par Renforcement

Kaiyi Zhang, Wei Wu, Yankai Lin

L'évaluation interactive nécessite une approche de science du design

Keyang Xuan, Peiyang Song, Pan Lu, et al.

ESI-BENCH : Vers une intelligence spatiale incarnée qui referme la boucle perception-action

Intelligence Incarnée

Yining Hong, Jiageng Liu, Han Yin, et al.

Analyse comparative de la détection militaire à l'aide d'images de drones à travers plusieurs spectres visuels

Détection D'objets

Vision Par Ordinateur

Sourov Roy Shuvo, Prajwal Panth, Rajesh Chowdhury, et al.

Classification automatisée des diagnostics psychiatriques selon la CIM : des méthodes classiques de TALN aux grands modèles de langage

Traitement Du Langage Naturel

Fernando Ortega, Raúl Lara-Cabrera, Jorge Dueñas-Lerín, et al.

Gestion coordonnée et optimale de la qualité de l'alimentation dans les réseaux de distribution en utilisant la capacité résiduelle des IBR communautaires

Génération De Texte

Tiantian Ji, Pengfeng Lin, Miao Zhu, et al.

EllipseLIO : Odométrie LiDAR inertielle adaptative avec une représentation ellipsoïdale

Vision Machine 3D

Rowan Border, Margarita Chli

SMoA : Adaptateur de modulation de spectre pour le réglage fin efficace en paramètres

Entraînement Du Modèle

Yongkang Liu, Xing Li, Mengjie Zhao, et al.

Détection des réseaux de neurones artificiels profonds piégés par analyse de régression spectrale

Apprentissage Profond

Entraînement Du Modèle

Samuele Pasini, Jinhan Kim, Paolo Tonella

L'illusion de la pensée : comprendre les forces et les limites des modèles de raisonnement à travers le prisme de la complexité des problèmes

Parshin Shojae, Iman Mirzadeh, Keivan Alizadeh, et al.

Raisonnement Récursif Génératif

Génération De Texte

Junyeob Baek, Mingyu Jo, Minsu Kim, et al.

Pré-entraînement de sécurité : vers une nouvelle génération d'IA sécurisée

Entraînement Du Modèle

Pratyush Maini, Sachin Goyal, Dylan Sam, et al.

RubricEM : Apprentissage par renforcement méta-avec décomposition de politique guidée par une grille d'évaluation, au-delà des récompenses vérifiables

Apprentissage Par Renforcement

Gaotang Li, Bhavana Dalvi Mishra, Zifeng Wang, et al.

Lorsque la vision parle pour le son

Compréhension Vidéo

Xiaofei Wen, Wenjie Jacky Mo, Xingyu Fu, et al.

AutoResearchClaw : Recherche autonome auto-renforçante avec collaboration humain-IA

IA Pour La Science

Jiaqi Liu, Shi Qiu, Mairui Li, et al.

Récompenses de processus avec fiabilité apprise

Apprentissage Par Renforcement

Jinyuan Li, Langlin Huang, Chengsong Huang, et al.

GoLongRL : Apprentissage par renforcement de contexte long orienté vers les capacités avec alignement multitâche

Apprentissage Par Renforcement

Minxuan Lv, Tiehua Mei, Tanlong Du, et al.

OpenComputer : des mondes logiciels vérifiables pour les agents d'utilisation d'ordinateur

Jinbiao Wei, Qianran Ma, Yilun Zhao, et al.

Anti-Auto-Distillation pour le Renforcement par Apprentissage par Renforcement via l'Information Mutuelle Ponctuelle

Apprentissage Par Renforcement

Guobin Shen, Xiang Cheng, Chenxiao Zhao, et al.

Modulation ciblée des neurones par recherche de paires contrastives

Affinage Supervisé

Sam Herring, Jake Naviasky, Karan Malhotra

Continuous Diffusion Scales Compétitivement avec Discrete Diffusion pour Langage

Modèle De Diffusion

Génération De Texte

Zhihan Yang, Wei Guo, Shuibai Zhang, et al.

KVPO : GRPO natif pour les EDO pour l'alignement vidéo autoregressif via l'exploration sémantique KV

Génération De Vidéo

Texte Vers Vidéo

Ruicheng Zhang, Kaixi Cong, Jun Zhou, et al.

Code-as-Room : Génération de salles 3D à partir d'images de vue de dessus via la synthèse de code agentic

Génération 3D

Yixuan Yang, Zhen Luo, Wanshui Gan, et al.

IA pour l'auto-recherche : feuille de route et guide utilisateur

IA Pour La Science

Lingdong Kong, Xian Sun, Wei Chow, et al.

SkillsVote : Gouvernance du cycle de vie des compétences des agents, de la collecte et de la recommandation à l'évolution

Hongyi Liu, Haoyan Yang, Tao Jiang, et al.

Lance : Modélisation multimodale unifiée par synergie multi-tâches

Génération D'images

Fengyi Fu, Mengqi Huang, Shaojin Wu, et al.

LongLive-2.0 : Une infrastructure parallèle NVFP4 pour la génération de vidéos longues

Génération De Vidéo

Modèle De Diffusion

Yukang Chen, Luozhou Wang, Wei Huang, et al.

Découpage et Analyse Fine : Configuration de Mélanges Optimaux d'Experts

Entraînement Du Modèle

Margaret Li, Sneha Kudugunta, Danielle Rothermel, et al.

Découverte Agentique des Architectures Neurales : AIRA-Compose et AIRA-Design

Apprentissage Profond

Alberto Pepe, Chien-Yu Lin, Despoina Magka, et al.

Apprendre à prévoir : Révéler l'efficacité de déverrouillage de la distillation sur politique

Affinage Supervisé

Yuchen Cai, Ding Cao, Liang Lin, et al.

DexJoCo : une plateforme d'évaluation et une boîte à outils pour la manipulation déxtere orientée tâche sur MuJoCo

Hanwen Wang, Weizhi Zhao, Xiangyu Wang, et al.

TransitLM : un jeu de données et un benchmark à grande échelle pour la génération d'itinéraires de transport en commun sans carte

TransitLM : un jeu de données et un benchmark à grande échelle pour la génération d'itinéraires de transport en commun sans carte

Hanyu Guo, Jiedong Yang, Chao Chen, et al.

DelTA : Attribution discriminative de crédit de token pour l'apprentissage par renforcement à partir de récompenses vérifiables

DelTA : Attribution discriminative de crédit de token pour l'apprentissage par renforcement à partir de récompenses vérifiables

Apprentissage Par Renforcement

Kaiyi Zhang, Wei Wu, Yankai Lin

L'évaluation interactive nécessite une approche de science du design

Keyang Xuan, Peiyang Song, Pan Lu, et al.

ESI-BENCH : Vers une intelligence spatiale incarnée qui referme la boucle perception-action

Intelligence Incarnée

Yining Hong, Jiageng Liu, Han Yin, et al.

Analyse comparative de la détection militaire à l'aide d'images de drones à travers plusieurs spectres visuels

Détection D'objets

Vision Par Ordinateur

Sourov Roy Shuvo, Prajwal Panth, Rajesh Chowdhury, et al.

Classification automatisée des diagnostics psychiatriques selon la CIM : des méthodes classiques de TALN aux grands modèles de langage

Traitement Du Langage Naturel

Fernando Ortega, Raúl Lara-Cabrera, Jorge Dueñas-Lerín, et al.

Gestion coordonnée et optimale de la qualité de l'alimentation dans les réseaux de distribution en utilisant la capacité résiduelle des IBR communautaires

Génération De Texte

Tiantian Ji, Pengfeng Lin, Miao Zhu, et al.

EllipseLIO : Odométrie LiDAR inertielle adaptative avec une représentation ellipsoïdale

Vision Machine 3D

Rowan Border, Margarita Chli

SMoA : Adaptateur de modulation de spectre pour le réglage fin efficace en paramètres

Entraînement Du Modèle

Yongkang Liu, Xing Li, Mengjie Zhao, et al.

Détection des réseaux de neurones artificiels profonds piégés par analyse de régression spectrale

Apprentissage Profond

Entraînement Du Modèle

Samuele Pasini, Jinhan Kim, Paolo Tonella

L'illusion de la pensée : comprendre les forces et les limites des modèles de raisonnement à travers le prisme de la complexité des problèmes

Parshin Shojae, Iman Mirzadeh, Keivan Alizadeh, et al.

Raisonnement Récursif Génératif

Génération De Texte

Junyeob Baek, Mingyu Jo, Minsu Kim, et al.

Pré-entraînement de sécurité : vers une nouvelle génération d'IA sécurisée

Entraînement Du Modèle

Pratyush Maini, Sachin Goyal, Dylan Sam, et al.

RubricEM : Apprentissage par renforcement méta-avec décomposition de politique guidée par une grille d'évaluation, au-delà des récompenses vérifiables

Apprentissage Par Renforcement

Gaotang Li, Bhavana Dalvi Mishra, Zifeng Wang, et al.

Lorsque la vision parle pour le son

Compréhension Vidéo

Xiaofei Wen, Wenjie Jacky Mo, Xingyu Fu, et al.

AutoResearchClaw : Recherche autonome auto-renforçante avec collaboration humain-IA

IA Pour La Science

Jiaqi Liu, Shi Qiu, Mairui Li, et al.

Récompenses de processus avec fiabilité apprise

Apprentissage Par Renforcement

Jinyuan Li, Langlin Huang, Chengsong Huang, et al.

GoLongRL : Apprentissage par renforcement de contexte long orienté vers les capacités avec alignement multitâche

Apprentissage Par Renforcement

Minxuan Lv, Tiehua Mei, Tanlong Du, et al.

OpenComputer : des mondes logiciels vérifiables pour les agents d'utilisation d'ordinateur

Jinbiao Wei, Qianran Ma, Yilun Zhao, et al.

Anti-Auto-Distillation pour le Renforcement par Apprentissage par Renforcement via l'Information Mutuelle Ponctuelle

Apprentissage Par Renforcement

Guobin Shen, Xiang Cheng, Chenxiao Zhao, et al.

Modulation ciblée des neurones par recherche de paires contrastives

Affinage Supervisé

Sam Herring, Jake Naviasky, Karan Malhotra

Continuous Diffusion Scales Compétitivement avec Discrete Diffusion pour Langage

Modèle De Diffusion

Génération De Texte

Zhihan Yang, Wei Guo, Shuibai Zhang, et al.

KVPO : GRPO natif pour les EDO pour l'alignement vidéo autoregressif via l'exploration sémantique KV

Génération De Vidéo

Texte Vers Vidéo

Ruicheng Zhang, Kaixi Cong, Jun Zhou, et al.

Code-as-Room : Génération de salles 3D à partir d'images de vue de dessus via la synthèse de code agentic

Génération 3D

Yixuan Yang, Zhen Luo, Wanshui Gan, et al.

IA pour l'auto-recherche : feuille de route et guide utilisateur

IA Pour La Science

Lingdong Kong, Xian Sun, Wei Chow, et al.

SkillsVote : Gouvernance du cycle de vie des compétences des agents, de la collecte et de la recommandation à l'évolution

Hongyi Liu, Haoyan Yang, Tao Jiang, et al.

Lance : Modélisation multimodale unifiée par synergie multi-tâches

Génération D'images

Fengyi Fu, Mengqi Huang, Shaojin Wu, et al.

LongLive-2.0 : Une infrastructure parallèle NVFP4 pour la génération de vidéos longues

Génération De Vidéo

Modèle De Diffusion

Yukang Chen, Luozhou Wang, Wei Huang, et al.

Découpage et Analyse Fine : Configuration de Mélanges Optimaux d'Experts

Entraînement Du Modèle

Margaret Li, Sneha Kudugunta, Danielle Rothermel, et al.

Découverte Agentique des Architectures Neurales : AIRA-Compose et AIRA-Design

Apprentissage Profond

Alberto Pepe, Chien-Yu Lin, Despoina Magka, et al.

Apprendre à prévoir : Révéler l'efficacité de déverrouillage de la distillation sur politique

Affinage Supervisé

Yuchen Cai, Ding Cao, Liang Lin, et al.

DexJoCo : une plateforme d'évaluation et une boîte à outils pour la manipulation déxtere orientée tâche sur MuJoCo

Hanwen Wang, Weizhi Zhao, Xiangyu Wang, et al.

L'évaluation interactive nécessite une approche de science du design

ESI-BENCH : Vers une intelligence spatiale incarnée qui referme la boucle perception-action

Analyse comparative de la détection militaire à l'aide d'images de drones à travers plusieurs spectres visuels

Classification automatisée des diagnostics psychiatriques selon la CIM : des méthodes classiques de TALN aux grands modèles de langage

Gestion coordonnée et optimale de la qualité de l'alimentation dans les réseaux de distribution en utilisant la capacité résiduelle des IBR communautaires

EllipseLIO : Odométrie LiDAR inertielle adaptative avec une représentation ellipsoïdale

SMoA : Adaptateur de modulation de spectre pour le réglage fin efficace en paramètres

Détection des réseaux de neurones artificiels profonds piégés par analyse de régression spectrale

L'illusion de la pensée : comprendre les forces et les limites des modèles de raisonnement à travers le prisme de la complexité des problèmes

Raisonnement Récursif Génératif

Pré-entraînement de sécurité : vers une nouvelle génération d'IA sécurisée

RubricEM : Apprentissage par renforcement méta-avec décomposition de politique guidée par une grille d'évaluation, au-delà des récompenses vérifiables

Lorsque la vision parle pour le son

AutoResearchClaw : Recherche autonome auto-renforçante avec collaboration humain-IA

Récompenses de processus avec fiabilité apprise

GoLongRL : Apprentissage par renforcement de contexte long orienté vers les capacités avec alignement multitâche

OpenComputer : des mondes logiciels vérifiables pour les agents d'utilisation d'ordinateur

Anti-Auto-Distillation pour le Renforcement par Apprentissage par Renforcement via l'Information Mutuelle Ponctuelle

Modulation ciblée des neurones par recherche de paires contrastives

Continuous Diffusion Scales Compétitivement avec Discrete Diffusion pour Langage

KVPO : GRPO natif pour les EDO pour l'alignement vidéo autoregressif via l'exploration sémantique KV

Code-as-Room : Génération de salles 3D à partir d'images de vue de dessus via la synthèse de code agentic

IA pour l'auto-recherche : feuille de route et guide utilisateur

SkillsVote : Gouvernance du cycle de vie des compétences des agents, de la collecte et de la recommandation à l'évolution

Lance : Modélisation multimodale unifiée par synergie multi-tâches

LongLive-2.0 : Une infrastructure parallèle NVFP4 pour la génération de vidéos longues

Découpage et Analyse Fine : Configuration de Mélanges Optimaux d'Experts

Découverte Agentique des Architectures Neurales : AIRA-Compose et AIRA-Design

Apprendre à prévoir : Révéler l'efficacité de déverrouillage de la distillation sur politique

DexJoCo : une plateforme d'évaluation et une boîte à outils pour la manipulation déxtere orientée tâche sur MuJoCo

L'évaluation interactive nécessite une approche de science du design

ESI-BENCH : Vers une intelligence spatiale incarnée qui referme la boucle perception-action

Analyse comparative de la détection militaire à l'aide d'images de drones à travers plusieurs spectres visuels

Classification automatisée des diagnostics psychiatriques selon la CIM : des méthodes classiques de TALN aux grands modèles de langage

Gestion coordonnée et optimale de la qualité de l'alimentation dans les réseaux de distribution en utilisant la capacité résiduelle des IBR communautaires

EllipseLIO : Odométrie LiDAR inertielle adaptative avec une représentation ellipsoïdale

SMoA : Adaptateur de modulation de spectre pour le réglage fin efficace en paramètres

Détection des réseaux de neurones artificiels profonds piégés par analyse de régression spectrale

L'illusion de la pensée : comprendre les forces et les limites des modèles de raisonnement à travers le prisme de la complexité des problèmes

Raisonnement Récursif Génératif

Pré-entraînement de sécurité : vers une nouvelle génération d'IA sécurisée

RubricEM : Apprentissage par renforcement méta-avec décomposition de politique guidée par une grille d'évaluation, au-delà des récompenses vérifiables

Lorsque la vision parle pour le son

AutoResearchClaw : Recherche autonome auto-renforçante avec collaboration humain-IA

Récompenses de processus avec fiabilité apprise

GoLongRL : Apprentissage par renforcement de contexte long orienté vers les capacités avec alignement multitâche

OpenComputer : des mondes logiciels vérifiables pour les agents d'utilisation d'ordinateur

Anti-Auto-Distillation pour le Renforcement par Apprentissage par Renforcement via l'Information Mutuelle Ponctuelle

Modulation ciblée des neurones par recherche de paires contrastives

Continuous Diffusion Scales Compétitivement avec Discrete Diffusion pour Langage

KVPO : GRPO natif pour les EDO pour l'alignement vidéo autoregressif via l'exploration sémantique KV

Code-as-Room : Génération de salles 3D à partir d'images de vue de dessus via la synthèse de code agentic

IA pour l'auto-recherche : feuille de route et guide utilisateur

SkillsVote : Gouvernance du cycle de vie des compétences des agents, de la collecte et de la recommandation à l'évolution

Lance : Modélisation multimodale unifiée par synergie multi-tâches

LongLive-2.0 : Une infrastructure parallèle NVFP4 pour la génération de vidéos longues

Découpage et Analyse Fine : Configuration de Mélanges Optimaux d'Experts

Découverte Agentique des Architectures Neurales : AIRA-Compose et AIRA-Design

Apprendre à prévoir : Révéler l'efficacité de déverrouillage de la distillation sur politique

DexJoCo : une plateforme d'évaluation et une boîte à outils pour la manipulation déxtere orientée tâche sur MuJoCo