HyperAI

Principal

GPU

Console
Studio
Docs
Tarifs

Pulse

Actualités

Ressources

Publications de recherche
Notebooks
Jeux de données
Wiki

Benchmarks

SOTA
Modèles LLM
Classement des GPU

Communauté

Événements

Utilitaires

À propos Conditions d’utilisation Politique de confidentialité
Français

Command Palette

Search for a command to run...

HyperAI
Papers

Papers

Articles de recherche en IA de pointe mis à jour quotidiennement pour vous aider à suivre les dernières tendances en IA

Construire l’avenir de l’intelligence artificielle

À propos

À propos Support Aide relative au jeu de données

Produits

Actualités Publications de recherche Notebooks Jeux de données Wiki

Liens

© HyperAI

GitHub Discord X (formerly Twitter)

HyperAI

Principal

GPU

Console
Studio
Docs
Tarifs

Pulse

Actualités

Ressources

Publications de recherche
Notebooks
Jeux de données
Wiki

Benchmarks

SOTA
Modèles LLM
Classement des GPU

Communauté

Événements

Utilitaires

À propos Conditions d’utilisation Politique de confidentialité
Français

Command Palette

Search for a command to run...

HyperAI
Papers

Papers

Articles de recherche en IA de pointe mis à jour quotidiennement pour vous aider à suivre les dernières tendances en IA

Construire l’avenir de l’intelligence artificielle

À propos

À propos Support Aide relative au jeu de données

Produits

Actualités Publications de recherche Notebooks Jeux de données Wiki

Liens

© HyperAI

GitHub Discord X (formerly Twitter)

CVEvolve : Découverte autonome d'algorithmes pour le traitement des données scientifiques non structurées

CVEvolve : Découverte autonome d'algorithmes pour le traitement des données scientifiques non structurées

IA Pour La Science

Traitement D'images

Ming Du, Xiangyu Yin, Yanqi Luo, et al.

Poly-EPO : Entraînement des modèles de raisonnement exploratoire

Poly-EPO : Entraînement des modèles de raisonnement exploratoire

Apprentissage Par Renforcement

Ifdita Hasan Orney, Jubayer Ibn Hamid, Shreya S Ramanujam, et al.

Résumé

Génération Augmentée Par La Recherche

Ryan Wei Heng Quek, Sanghyuk Lee, Alfred Wei Lun Leong, et al.

ACC : Compilation des trajectoires d'agents pour l'entraînement à long contexte

Affinage Supervisé

Qisheng Su, Zhen Fang, Shiting Huang, et al.

L'attention complète frappe à nouveau : transférer l'attention complète en attention sparse en quelques centaines d'étapes d'entraînement

Yanke Zhou, Yiduo Li, Hanlin Tang, et al.

$π$-Bench : Évaluation des agents assistants personnels proactifs dans les workflows à long terme

Haoran Zhang, Luxin Xu, Zhilin Wang, et al.

Perception ou préjugé : les MLLMs peuvent-ils aller au-delà des premières impressions de personnalité ?

Caixin Kang, Tianyu Yan, Sitong Gong, et al.

TransitLM : un jeu de données et un benchmark à grande échelle pour la génération d'itinéraires de transport en commun sans carte

Hanyu Guo, Jiedong Yang, Chao Chen, et al.

DelTA : Attribution discriminative de crédit de token pour l'apprentissage par renforcement à partir de récompenses vérifiables

Apprentissage Par Renforcement

Kaiyi Zhang, Wei Wu, Yankai Lin

L'évaluation interactive nécessite une approche de science du design

Keyang Xuan, Peiyang Song, Pan Lu, et al.

ESI-BENCH : Vers une intelligence spatiale incarnée qui referme la boucle perception-action

Intelligence Incarnée

Yining Hong, Jiageng Liu, Han Yin, et al.

Analyse comparative de la détection militaire à l'aide d'images de drones à travers plusieurs spectres visuels

Détection D'objets

Vision Par Ordinateur

Sourov Roy Shuvo, Prajwal Panth, Rajesh Chowdhury, et al.

Classification automatisée des diagnostics psychiatriques selon la CIM : des méthodes classiques de TALN aux grands modèles de langage

Traitement Du Langage Naturel

Fernando Ortega, Raúl Lara-Cabrera, Jorge Dueñas-Lerín, et al.

Gestion coordonnée et optimale de la qualité de l'alimentation dans les réseaux de distribution en utilisant la capacité résiduelle des IBR communautaires

Génération De Texte

Tiantian Ji, Pengfeng Lin, Miao Zhu, et al.

EllipseLIO : Odométrie LiDAR inertielle adaptative avec une représentation ellipsoïdale

Vision Machine 3D

Rowan Border, Margarita Chli

SMoA : Adaptateur de modulation de spectre pour le réglage fin efficace en paramètres

Entraînement Du Modèle

Yongkang Liu, Xing Li, Mengjie Zhao, et al.

Détection des réseaux de neurones artificiels profonds piégés par analyse de régression spectrale

Apprentissage Profond

Entraînement Du Modèle

Samuele Pasini, Jinhan Kim, Paolo Tonella

L'illusion de la pensée : comprendre les forces et les limites des modèles de raisonnement à travers le prisme de la complexité des problèmes

Parshin Shojae, Iman Mirzadeh, Keivan Alizadeh, et al.

Raisonnement Récursif Génératif

Génération De Texte

Junyeob Baek, Mingyu Jo, Minsu Kim, et al.

Pré-entraînement de sécurité : vers une nouvelle génération d'IA sécurisée

Entraînement Du Modèle

Pratyush Maini, Sachin Goyal, Dylan Sam, et al.

RubricEM : Apprentissage par renforcement méta-avec décomposition de politique guidée par une grille d'évaluation, au-delà des récompenses vérifiables

Apprentissage Par Renforcement

Gaotang Li, Bhavana Dalvi Mishra, Zifeng Wang, et al.

Lorsque la vision parle pour le son

Compréhension Vidéo

Xiaofei Wen, Wenjie Jacky Mo, Xingyu Fu, et al.

AutoResearchClaw : Recherche autonome auto-renforçante avec collaboration humain-IA

IA Pour La Science

Jiaqi Liu, Shi Qiu, Mairui Li, et al.

Récompenses de processus avec fiabilité apprise

Apprentissage Par Renforcement

Jinyuan Li, Langlin Huang, Chengsong Huang, et al.

GoLongRL : Apprentissage par renforcement de contexte long orienté vers les capacités avec alignement multitâche

Apprentissage Par Renforcement

Minxuan Lv, Tiehua Mei, Tanlong Du, et al.

OpenComputer : des mondes logiciels vérifiables pour les agents d'utilisation d'ordinateur

Jinbiao Wei, Qianran Ma, Yilun Zhao, et al.

Anti-Auto-Distillation pour le Renforcement par Apprentissage par Renforcement via l'Information Mutuelle Ponctuelle

Apprentissage Par Renforcement

Guobin Shen, Xiang Cheng, Chenxiao Zhao, et al.

Modulation ciblée des neurones par recherche de paires contrastives

Affinage Supervisé

Sam Herring, Jake Naviasky, Karan Malhotra

Continuous Diffusion Scales Compétitivement avec Discrete Diffusion pour Langage

Modèle De Diffusion

Génération De Texte

Zhihan Yang, Wei Guo, Shuibai Zhang, et al.

KVPO : GRPO natif pour les EDO pour l'alignement vidéo autoregressif via l'exploration sémantique KV

Génération De Vidéo

Texte Vers Vidéo

Ruicheng Zhang, Kaixi Cong, Jun Zhou, et al.

Code-as-Room : Génération de salles 3D à partir d'images de vue de dessus via la synthèse de code agentic

Génération 3D

Yixuan Yang, Zhen Luo, Wanshui Gan, et al.

IA pour l'auto-recherche : feuille de route et guide utilisateur

IA Pour La Science

Lingdong Kong, Xian Sun, Wei Chow, et al.

CVEvolve : Découverte autonome d'algorithmes pour le traitement des données scientifiques non structurées

CVEvolve : Découverte autonome d'algorithmes pour le traitement des données scientifiques non structurées

IA Pour La Science

Traitement D'images

Ming Du, Xiangyu Yin, Yanqi Luo, et al.

Poly-EPO : Entraînement des modèles de raisonnement exploratoire

Poly-EPO : Entraînement des modèles de raisonnement exploratoire

Apprentissage Par Renforcement

Ifdita Hasan Orney, Jubayer Ibn Hamid, Shreya S Ramanujam, et al.

Résumé

Génération Augmentée Par La Recherche

Ryan Wei Heng Quek, Sanghyuk Lee, Alfred Wei Lun Leong, et al.

ACC : Compilation des trajectoires d'agents pour l'entraînement à long contexte

Affinage Supervisé

Qisheng Su, Zhen Fang, Shiting Huang, et al.

L'attention complète frappe à nouveau : transférer l'attention complète en attention sparse en quelques centaines d'étapes d'entraînement

Yanke Zhou, Yiduo Li, Hanlin Tang, et al.

$π$-Bench : Évaluation des agents assistants personnels proactifs dans les workflows à long terme

Haoran Zhang, Luxin Xu, Zhilin Wang, et al.

Perception ou préjugé : les MLLMs peuvent-ils aller au-delà des premières impressions de personnalité ?

Caixin Kang, Tianyu Yan, Sitong Gong, et al.

TransitLM : un jeu de données et un benchmark à grande échelle pour la génération d'itinéraires de transport en commun sans carte

Hanyu Guo, Jiedong Yang, Chao Chen, et al.

DelTA : Attribution discriminative de crédit de token pour l'apprentissage par renforcement à partir de récompenses vérifiables

Apprentissage Par Renforcement

Kaiyi Zhang, Wei Wu, Yankai Lin

L'évaluation interactive nécessite une approche de science du design

Keyang Xuan, Peiyang Song, Pan Lu, et al.

ESI-BENCH : Vers une intelligence spatiale incarnée qui referme la boucle perception-action

Intelligence Incarnée

Yining Hong, Jiageng Liu, Han Yin, et al.

Analyse comparative de la détection militaire à l'aide d'images de drones à travers plusieurs spectres visuels

Détection D'objets

Vision Par Ordinateur

Sourov Roy Shuvo, Prajwal Panth, Rajesh Chowdhury, et al.

Classification automatisée des diagnostics psychiatriques selon la CIM : des méthodes classiques de TALN aux grands modèles de langage

Traitement Du Langage Naturel

Fernando Ortega, Raúl Lara-Cabrera, Jorge Dueñas-Lerín, et al.

Gestion coordonnée et optimale de la qualité de l'alimentation dans les réseaux de distribution en utilisant la capacité résiduelle des IBR communautaires

Génération De Texte

Tiantian Ji, Pengfeng Lin, Miao Zhu, et al.

EllipseLIO : Odométrie LiDAR inertielle adaptative avec une représentation ellipsoïdale

Vision Machine 3D

Rowan Border, Margarita Chli

SMoA : Adaptateur de modulation de spectre pour le réglage fin efficace en paramètres

Entraînement Du Modèle

Yongkang Liu, Xing Li, Mengjie Zhao, et al.

Détection des réseaux de neurones artificiels profonds piégés par analyse de régression spectrale

Apprentissage Profond

Entraînement Du Modèle

Samuele Pasini, Jinhan Kim, Paolo Tonella

L'illusion de la pensée : comprendre les forces et les limites des modèles de raisonnement à travers le prisme de la complexité des problèmes

Parshin Shojae, Iman Mirzadeh, Keivan Alizadeh, et al.

Raisonnement Récursif Génératif

Génération De Texte

Junyeob Baek, Mingyu Jo, Minsu Kim, et al.

Pré-entraînement de sécurité : vers une nouvelle génération d'IA sécurisée

Entraînement Du Modèle

Pratyush Maini, Sachin Goyal, Dylan Sam, et al.

RubricEM : Apprentissage par renforcement méta-avec décomposition de politique guidée par une grille d'évaluation, au-delà des récompenses vérifiables

Apprentissage Par Renforcement

Gaotang Li, Bhavana Dalvi Mishra, Zifeng Wang, et al.

Lorsque la vision parle pour le son

Compréhension Vidéo

Xiaofei Wen, Wenjie Jacky Mo, Xingyu Fu, et al.

AutoResearchClaw : Recherche autonome auto-renforçante avec collaboration humain-IA

IA Pour La Science

Jiaqi Liu, Shi Qiu, Mairui Li, et al.

Récompenses de processus avec fiabilité apprise

Apprentissage Par Renforcement

Jinyuan Li, Langlin Huang, Chengsong Huang, et al.

GoLongRL : Apprentissage par renforcement de contexte long orienté vers les capacités avec alignement multitâche

Apprentissage Par Renforcement

Minxuan Lv, Tiehua Mei, Tanlong Du, et al.

OpenComputer : des mondes logiciels vérifiables pour les agents d'utilisation d'ordinateur

Jinbiao Wei, Qianran Ma, Yilun Zhao, et al.

Anti-Auto-Distillation pour le Renforcement par Apprentissage par Renforcement via l'Information Mutuelle Ponctuelle

Apprentissage Par Renforcement

Guobin Shen, Xiang Cheng, Chenxiao Zhao, et al.

Modulation ciblée des neurones par recherche de paires contrastives

Affinage Supervisé

Sam Herring, Jake Naviasky, Karan Malhotra

Continuous Diffusion Scales Compétitivement avec Discrete Diffusion pour Langage

Modèle De Diffusion

Génération De Texte

Zhihan Yang, Wei Guo, Shuibai Zhang, et al.

KVPO : GRPO natif pour les EDO pour l'alignement vidéo autoregressif via l'exploration sémantique KV

Génération De Vidéo

Texte Vers Vidéo

Ruicheng Zhang, Kaixi Cong, Jun Zhou, et al.

Code-as-Room : Génération de salles 3D à partir d'images de vue de dessus via la synthèse de code agentic

Génération 3D

Yixuan Yang, Zhen Luo, Wanshui Gan, et al.

IA pour l'auto-recherche : feuille de route et guide utilisateur

IA Pour La Science

Lingdong Kong, Xian Sun, Wei Chow, et al.

Résumé

ACC : Compilation des trajectoires d'agents pour l'entraînement à long contexte

L'attention complète frappe à nouveau : transférer l'attention complète en attention sparse en quelques centaines d'étapes d'entraînement

$π$ -Bench : Évaluation des agents assistants personnels proactifs dans les workflows à long terme

Perception ou préjugé : les MLLMs peuvent-ils aller au-delà des premières impressions de personnalité ?

TransitLM : un jeu de données et un benchmark à grande échelle pour la génération d'itinéraires de transport en commun sans carte

DelTA : Attribution discriminative de crédit de token pour l'apprentissage par renforcement à partir de récompenses vérifiables

L'évaluation interactive nécessite une approche de science du design

ESI-BENCH : Vers une intelligence spatiale incarnée qui referme la boucle perception-action

Analyse comparative de la détection militaire à l'aide d'images de drones à travers plusieurs spectres visuels

Classification automatisée des diagnostics psychiatriques selon la CIM : des méthodes classiques de TALN aux grands modèles de langage

Gestion coordonnée et optimale de la qualité de l'alimentation dans les réseaux de distribution en utilisant la capacité résiduelle des IBR communautaires

EllipseLIO : Odométrie LiDAR inertielle adaptative avec une représentation ellipsoïdale

SMoA : Adaptateur de modulation de spectre pour le réglage fin efficace en paramètres

Détection des réseaux de neurones artificiels profonds piégés par analyse de régression spectrale

L'illusion de la pensée : comprendre les forces et les limites des modèles de raisonnement à travers le prisme de la complexité des problèmes

Raisonnement Récursif Génératif

Pré-entraînement de sécurité : vers une nouvelle génération d'IA sécurisée

RubricEM : Apprentissage par renforcement méta-avec décomposition de politique guidée par une grille d'évaluation, au-delà des récompenses vérifiables

Lorsque la vision parle pour le son

AutoResearchClaw : Recherche autonome auto-renforçante avec collaboration humain-IA

Récompenses de processus avec fiabilité apprise

GoLongRL : Apprentissage par renforcement de contexte long orienté vers les capacités avec alignement multitâche

OpenComputer : des mondes logiciels vérifiables pour les agents d'utilisation d'ordinateur

Anti-Auto-Distillation pour le Renforcement par Apprentissage par Renforcement via l'Information Mutuelle Ponctuelle

Modulation ciblée des neurones par recherche de paires contrastives

Continuous Diffusion Scales Compétitivement avec Discrete Diffusion pour Langage

KVPO : GRPO natif pour les EDO pour l'alignement vidéo autoregressif via l'exploration sémantique KV

Code-as-Room : Génération de salles 3D à partir d'images de vue de dessus via la synthèse de code agentic

IA pour l'auto-recherche : feuille de route et guide utilisateur

Résumé

ACC : Compilation des trajectoires d'agents pour l'entraînement à long contexte

L'attention complète frappe à nouveau : transférer l'attention complète en attention sparse en quelques centaines d'étapes d'entraînement

$π$ -Bench : Évaluation des agents assistants personnels proactifs dans les workflows à long terme

Perception ou préjugé : les MLLMs peuvent-ils aller au-delà des premières impressions de personnalité ?

TransitLM : un jeu de données et un benchmark à grande échelle pour la génération d'itinéraires de transport en commun sans carte

DelTA : Attribution discriminative de crédit de token pour l'apprentissage par renforcement à partir de récompenses vérifiables

L'évaluation interactive nécessite une approche de science du design

ESI-BENCH : Vers une intelligence spatiale incarnée qui referme la boucle perception-action

Analyse comparative de la détection militaire à l'aide d'images de drones à travers plusieurs spectres visuels

Classification automatisée des diagnostics psychiatriques selon la CIM : des méthodes classiques de TALN aux grands modèles de langage

Gestion coordonnée et optimale de la qualité de l'alimentation dans les réseaux de distribution en utilisant la capacité résiduelle des IBR communautaires

EllipseLIO : Odométrie LiDAR inertielle adaptative avec une représentation ellipsoïdale

SMoA : Adaptateur de modulation de spectre pour le réglage fin efficace en paramètres

Détection des réseaux de neurones artificiels profonds piégés par analyse de régression spectrale

L'illusion de la pensée : comprendre les forces et les limites des modèles de raisonnement à travers le prisme de la complexité des problèmes

Raisonnement Récursif Génératif

Pré-entraînement de sécurité : vers une nouvelle génération d'IA sécurisée

RubricEM : Apprentissage par renforcement méta-avec décomposition de politique guidée par une grille d'évaluation, au-delà des récompenses vérifiables

Lorsque la vision parle pour le son

AutoResearchClaw : Recherche autonome auto-renforçante avec collaboration humain-IA

Récompenses de processus avec fiabilité apprise

GoLongRL : Apprentissage par renforcement de contexte long orienté vers les capacités avec alignement multitâche

OpenComputer : des mondes logiciels vérifiables pour les agents d'utilisation d'ordinateur

Anti-Auto-Distillation pour le Renforcement par Apprentissage par Renforcement via l'Information Mutuelle Ponctuelle

Modulation ciblée des neurones par recherche de paires contrastives

Continuous Diffusion Scales Compétitivement avec Discrete Diffusion pour Langage

KVPO : GRPO natif pour les EDO pour l'alignement vidéo autoregressif via l'exploration sémantique KV

Code-as-Room : Génération de salles 3D à partir d'images de vue de dessus via la synthèse de code agentic

IA pour l'auto-recherche : feuille de route et guide utilisateur