HyperAI

Principal

GPU

Console
Studio
Docs
Tarifs

Pulse

Actualités

Ressources

Publications de recherche
Notebooks
Jeux de données
Wiki

Benchmarks

SOTA
Modèles LLM
Classement des GPU

Communauté

Événements

Utilitaires

À propos Conditions d’utilisation Politique de confidentialité
Français

Command Palette

Search for a command to run...

HyperAI
Papers

Papers

Articles de recherche en IA de pointe mis à jour quotidiennement pour vous aider à suivre les dernières tendances en IA

Construire l’avenir de l’intelligence artificielle

À propos

À propos Support Aide relative au jeu de données

Produits

Actualités Publications de recherche Notebooks Jeux de données Wiki

Liens

© HyperAI

GitHub Discord X (formerly Twitter)

HyperAI

Principal

GPU

Console
Studio
Docs
Tarifs

Pulse

Actualités

Ressources

Publications de recherche
Notebooks
Jeux de données
Wiki

Benchmarks

SOTA
Modèles LLM
Classement des GPU

Communauté

Événements

Utilitaires

À propos Conditions d’utilisation Politique de confidentialité
Français

Command Palette

Search for a command to run...

HyperAI
Papers

Papers

Articles de recherche en IA de pointe mis à jour quotidiennement pour vous aider à suivre les dernières tendances en IA

Construire l’avenir de l’intelligence artificielle

À propos

À propos Support Aide relative au jeu de données

Produits

Actualités Publications de recherche Notebooks Jeux de données Wiki

Liens

© HyperAI

GitHub Discord X (formerly Twitter)

AutoResearchClaw : Recherche autonome auto-renforçante avec collaboration humain-IA

AutoResearchClaw : Recherche autonome auto-renforçante avec collaboration humain-IA

IA Pour La Science

Jiaqi Liu, Shi Qiu, Mairui Li, et al.

Récompenses de processus avec fiabilité apprise

Récompenses de processus avec fiabilité apprise

Apprentissage Par Renforcement

Jinyuan Li, Langlin Huang, Chengsong Huang, et al.

GoLongRL : Apprentissage par renforcement de contexte long orienté vers les capacités avec alignement multitâche

Apprentissage Par Renforcement

Minxuan Lv, Tiehua Mei, Tanlong Du, et al.

OpenComputer : des mondes logiciels vérifiables pour les agents d'utilisation d'ordinateur

Jinbiao Wei, Qianran Ma, Yilun Zhao, et al.

Anti-Auto-Distillation pour le Renforcement par Apprentissage par Renforcement via l'Information Mutuelle Ponctuelle

Apprentissage Par Renforcement

Guobin Shen, Xiang Cheng, Chenxiao Zhao, et al.

Modulation ciblée des neurones par recherche de paires contrastives

Affinage Supervisé

Sam Herring, Jake Naviasky, Karan Malhotra

Continuous Diffusion Scales Compétitivement avec Discrete Diffusion pour Langage

Modèle De Diffusion

Génération De Texte

Zhihan Yang, Wei Guo, Shuibai Zhang, et al.

KVPO : GRPO natif pour les EDO pour l'alignement vidéo autoregressif via l'exploration sémantique KV

Génération De Vidéo

Texte Vers Vidéo

Ruicheng Zhang, Kaixi Cong, Jun Zhou, et al.

Code-as-Room : Génération de salles 3D à partir d'images de vue de dessus via la synthèse de code agentic

Génération 3D

Yixuan Yang, Zhen Luo, Wanshui Gan, et al.

IA pour l'auto-recherche : feuille de route et guide utilisateur

IA Pour La Science

Lingdong Kong, Xian Sun, Wei Chow, et al.

SkillsVote : Gouvernance du cycle de vie des compétences des agents, de la collecte et de la recommandation à l'évolution

Hongyi Liu, Haoyan Yang, Tao Jiang, et al.

Lance : Modélisation multimodale unifiée par synergie multi-tâches

Génération D'images

Fengyi Fu, Mengqi Huang, Shaojin Wu, et al.

LongLive-2.0 : Une infrastructure parallèle NVFP4 pour la génération de vidéos longues

Génération De Vidéo

Modèle De Diffusion

Yukang Chen, Luozhou Wang, Wei Huang, et al.

Découpage et Analyse Fine : Configuration de Mélanges Optimaux d'Experts

Entraînement Du Modèle

Margaret Li, Sneha Kudugunta, Danielle Rothermel, et al.

Découverte Agentique des Architectures Neurales : AIRA-Compose et AIRA-Design

Apprentissage Profond

Alberto Pepe, Chien-Yu Lin, Despoina Magka, et al.

Apprendre à prévoir : Révéler l'efficacité de déverrouillage de la distillation sur politique

Affinage Supervisé

Yuchen Cai, Ding Cao, Liang Lin, et al.

DexJoCo : une plateforme d'évaluation et une boîte à outils pour la manipulation déxtere orientée tâche sur MuJoCo

Hanwen Wang, Weizhi Zhao, Xiangyu Wang, et al.

FashionChameleon : Vers une personnalisation vidéo en temps réel et interactive des vêtements humains

Génération De Vidéo

Image Vers Vidéo

Quanjian Song, Yefeng Shen, Mengting Chen, et al.

CiteVQA : Évaluation de l'attribution des preuves pour une intelligence documentaire fiable

Compréhension De Document

Réponse À Des Questions Visuelles

Dongsheng Ma, Jiayu Li, Zhengren Wang, et al.

MMSkills : Vers des compétences multimodales pour des agents visuels généraux

Représentation Multimodale

Kangning Zhang, Shuai Shao, Qingyao Li, et al.

PhysBrain 1.0 Rapport technique

Réponse À Des Questions Visuelles

Représentation Multimodale

Shijie Lian, Bin Yu, Xiaopeng Lin, et al.

Ramenation des modèles de valeur : critiques génératives pour la modélisation de la valeur dans l’apprentissage par renforcement des LLM

Apprentissage Par Renforcement

Zikang Shan, Han Zhong, Liwei Wang, et al.

NEXUS : Un cadre agentic pour la prévision des séries temporelles

Sarkar Snigdha Sarathi Das, Palash Goyal, Mihir Parmar, et al.

MemEye : Un cadre d'évaluation visuo-centré pour la mémoire des agents multimodaux

Minghao Guo, Qingyue Jiao, Zeru Shi, et al.

SANA-WM : Modélisation du monde efficace à l'échelle de la minute avec un Transformateur de Diffusion Linéaire Hybride

Modèle De Diffusion

Génération De Vidéo

Haoyi Zhu, Haozhe Liu, Yuyang Zhao, et al.

MemLens : Évaluation des modèles de vision-langage à grande échelle pour la mémoire multimodale à long terme

Réponse À Des Questions Visuelles

Xiyu Ren, Zhaowei Wang, Yiming Du, et al.

Apprentissage par renforcement agentique auto-distillé

Apprentissage Par Renforcement

Zhengxi Lu, Zhiyuan Yao, Zhuowen Han, et al.

Forçage causal++ : distillation de diffusion autoregressive à quelques étapes évolutive pour la génération vidéo interactive en temps réel

Génération De Vidéo

Modèle De Diffusion

Min Zhao, Hongzhou Zhu, Kaiwen Zheng, et al.

Obtenir un niveau de raisonnement olympique de médaille d'or via une mise à l'échelle simple et unifiée

Entraînement Du Modèle

Yafu Li, Runzhe Zhan, Haoran Zhang, et al.

RepoZero : Les LLMs peuvent-ils générer un dépôt de code à partir de zéro ?

Génération De Code

Zhaoxi Zhang, Yiming Xu, Jiahui Liang, et al.

Rapport technique Qwen-Image-VAE-2.0

Modèle De Diffusion

Génération D'images

Zekai Zhang, Deqing Li, Kuan Cao, et al.

Prédire les décisions des agents d'IA à partir d'interactions limitées par la modélisation textuelle et tabulaire

Eilam Shapira, Moshe Tennenholtz, Roi Reichart

AutoResearchClaw : Recherche autonome auto-renforçante avec collaboration humain-IA

AutoResearchClaw : Recherche autonome auto-renforçante avec collaboration humain-IA

IA Pour La Science

Jiaqi Liu, Shi Qiu, Mairui Li, et al.

Récompenses de processus avec fiabilité apprise

Récompenses de processus avec fiabilité apprise

Apprentissage Par Renforcement

Jinyuan Li, Langlin Huang, Chengsong Huang, et al.

GoLongRL : Apprentissage par renforcement de contexte long orienté vers les capacités avec alignement multitâche

Apprentissage Par Renforcement

Minxuan Lv, Tiehua Mei, Tanlong Du, et al.

OpenComputer : des mondes logiciels vérifiables pour les agents d'utilisation d'ordinateur

Jinbiao Wei, Qianran Ma, Yilun Zhao, et al.

Anti-Auto-Distillation pour le Renforcement par Apprentissage par Renforcement via l'Information Mutuelle Ponctuelle

Apprentissage Par Renforcement

Guobin Shen, Xiang Cheng, Chenxiao Zhao, et al.

Modulation ciblée des neurones par recherche de paires contrastives

Affinage Supervisé

Sam Herring, Jake Naviasky, Karan Malhotra

Continuous Diffusion Scales Compétitivement avec Discrete Diffusion pour Langage

Modèle De Diffusion

Génération De Texte

Zhihan Yang, Wei Guo, Shuibai Zhang, et al.

KVPO : GRPO natif pour les EDO pour l'alignement vidéo autoregressif via l'exploration sémantique KV

Génération De Vidéo

Texte Vers Vidéo

Ruicheng Zhang, Kaixi Cong, Jun Zhou, et al.

Code-as-Room : Génération de salles 3D à partir d'images de vue de dessus via la synthèse de code agentic

Génération 3D

Yixuan Yang, Zhen Luo, Wanshui Gan, et al.

IA pour l'auto-recherche : feuille de route et guide utilisateur

IA Pour La Science

Lingdong Kong, Xian Sun, Wei Chow, et al.

SkillsVote : Gouvernance du cycle de vie des compétences des agents, de la collecte et de la recommandation à l'évolution

Hongyi Liu, Haoyan Yang, Tao Jiang, et al.

Lance : Modélisation multimodale unifiée par synergie multi-tâches

Génération D'images

Fengyi Fu, Mengqi Huang, Shaojin Wu, et al.

LongLive-2.0 : Une infrastructure parallèle NVFP4 pour la génération de vidéos longues

Génération De Vidéo

Modèle De Diffusion

Yukang Chen, Luozhou Wang, Wei Huang, et al.

Découpage et Analyse Fine : Configuration de Mélanges Optimaux d'Experts

Entraînement Du Modèle

Margaret Li, Sneha Kudugunta, Danielle Rothermel, et al.

Découverte Agentique des Architectures Neurales : AIRA-Compose et AIRA-Design

Apprentissage Profond

Alberto Pepe, Chien-Yu Lin, Despoina Magka, et al.

Apprendre à prévoir : Révéler l'efficacité de déverrouillage de la distillation sur politique

Affinage Supervisé

Yuchen Cai, Ding Cao, Liang Lin, et al.

DexJoCo : une plateforme d'évaluation et une boîte à outils pour la manipulation déxtere orientée tâche sur MuJoCo

Hanwen Wang, Weizhi Zhao, Xiangyu Wang, et al.

FashionChameleon : Vers une personnalisation vidéo en temps réel et interactive des vêtements humains

Génération De Vidéo

Image Vers Vidéo

Quanjian Song, Yefeng Shen, Mengting Chen, et al.

CiteVQA : Évaluation de l'attribution des preuves pour une intelligence documentaire fiable

Compréhension De Document

Réponse À Des Questions Visuelles

Dongsheng Ma, Jiayu Li, Zhengren Wang, et al.

MMSkills : Vers des compétences multimodales pour des agents visuels généraux

Représentation Multimodale

Kangning Zhang, Shuai Shao, Qingyao Li, et al.

PhysBrain 1.0 Rapport technique

Réponse À Des Questions Visuelles

Représentation Multimodale

Shijie Lian, Bin Yu, Xiaopeng Lin, et al.

Ramenation des modèles de valeur : critiques génératives pour la modélisation de la valeur dans l’apprentissage par renforcement des LLM

Apprentissage Par Renforcement

Zikang Shan, Han Zhong, Liwei Wang, et al.

NEXUS : Un cadre agentic pour la prévision des séries temporelles

Sarkar Snigdha Sarathi Das, Palash Goyal, Mihir Parmar, et al.

MemEye : Un cadre d'évaluation visuo-centré pour la mémoire des agents multimodaux

Minghao Guo, Qingyue Jiao, Zeru Shi, et al.

SANA-WM : Modélisation du monde efficace à l'échelle de la minute avec un Transformateur de Diffusion Linéaire Hybride

Modèle De Diffusion

Génération De Vidéo

Haoyi Zhu, Haozhe Liu, Yuyang Zhao, et al.

MemLens : Évaluation des modèles de vision-langage à grande échelle pour la mémoire multimodale à long terme

Réponse À Des Questions Visuelles

Xiyu Ren, Zhaowei Wang, Yiming Du, et al.

Apprentissage par renforcement agentique auto-distillé

Apprentissage Par Renforcement

Zhengxi Lu, Zhiyuan Yao, Zhuowen Han, et al.

Forçage causal++ : distillation de diffusion autoregressive à quelques étapes évolutive pour la génération vidéo interactive en temps réel

Génération De Vidéo

Modèle De Diffusion

Min Zhao, Hongzhou Zhu, Kaiwen Zheng, et al.

Obtenir un niveau de raisonnement olympique de médaille d'or via une mise à l'échelle simple et unifiée

Entraînement Du Modèle

Yafu Li, Runzhe Zhan, Haoran Zhang, et al.

RepoZero : Les LLMs peuvent-ils générer un dépôt de code à partir de zéro ?

Génération De Code

Zhaoxi Zhang, Yiming Xu, Jiahui Liang, et al.

Rapport technique Qwen-Image-VAE-2.0

Modèle De Diffusion

Génération D'images

Zekai Zhang, Deqing Li, Kuan Cao, et al.

Prédire les décisions des agents d'IA à partir d'interactions limitées par la modélisation textuelle et tabulaire

Eilam Shapira, Moshe Tennenholtz, Roi Reichart

GoLongRL : Apprentissage par renforcement de contexte long orienté vers les capacités avec alignement multitâche

OpenComputer : des mondes logiciels vérifiables pour les agents d'utilisation d'ordinateur

Anti-Auto-Distillation pour le Renforcement par Apprentissage par Renforcement via l'Information Mutuelle Ponctuelle

Modulation ciblée des neurones par recherche de paires contrastives

Continuous Diffusion Scales Compétitivement avec Discrete Diffusion pour Langage

KVPO : GRPO natif pour les EDO pour l'alignement vidéo autoregressif via l'exploration sémantique KV

Code-as-Room : Génération de salles 3D à partir d'images de vue de dessus via la synthèse de code agentic

IA pour l'auto-recherche : feuille de route et guide utilisateur

SkillsVote : Gouvernance du cycle de vie des compétences des agents, de la collecte et de la recommandation à l'évolution

Lance : Modélisation multimodale unifiée par synergie multi-tâches

LongLive-2.0 : Une infrastructure parallèle NVFP4 pour la génération de vidéos longues

Découpage et Analyse Fine : Configuration de Mélanges Optimaux d'Experts

Découverte Agentique des Architectures Neurales : AIRA-Compose et AIRA-Design

Apprendre à prévoir : Révéler l'efficacité de déverrouillage de la distillation sur politique

DexJoCo : une plateforme d'évaluation et une boîte à outils pour la manipulation déxtere orientée tâche sur MuJoCo

FashionChameleon : Vers une personnalisation vidéo en temps réel et interactive des vêtements humains

CiteVQA : Évaluation de l'attribution des preuves pour une intelligence documentaire fiable

MMSkills : Vers des compétences multimodales pour des agents visuels généraux

PhysBrain 1.0 Rapport technique

Ramenation des modèles de valeur : critiques génératives pour la modélisation de la valeur dans l’apprentissage par renforcement des LLM

NEXUS : Un cadre agentic pour la prévision des séries temporelles

MemEye : Un cadre d'évaluation visuo-centré pour la mémoire des agents multimodaux

SANA-WM : Modélisation du monde efficace à l'échelle de la minute avec un Transformateur de Diffusion Linéaire Hybride

MemLens : Évaluation des modèles de vision-langage à grande échelle pour la mémoire multimodale à long terme

Apprentissage par renforcement agentique auto-distillé

Forçage causal++ : distillation de diffusion autoregressive à quelques étapes évolutive pour la génération vidéo interactive en temps réel

Obtenir un niveau de raisonnement olympique de médaille d'or via une mise à l'échelle simple et unifiée

RepoZero : Les LLMs peuvent-ils générer un dépôt de code à partir de zéro ?

Rapport technique Qwen-Image-VAE-2.0

Prédire les décisions des agents d'IA à partir d'interactions limitées par la modélisation textuelle et tabulaire

GoLongRL : Apprentissage par renforcement de contexte long orienté vers les capacités avec alignement multitâche

OpenComputer : des mondes logiciels vérifiables pour les agents d'utilisation d'ordinateur

Anti-Auto-Distillation pour le Renforcement par Apprentissage par Renforcement via l'Information Mutuelle Ponctuelle

Modulation ciblée des neurones par recherche de paires contrastives

Continuous Diffusion Scales Compétitivement avec Discrete Diffusion pour Langage

KVPO : GRPO natif pour les EDO pour l'alignement vidéo autoregressif via l'exploration sémantique KV

Code-as-Room : Génération de salles 3D à partir d'images de vue de dessus via la synthèse de code agentic

IA pour l'auto-recherche : feuille de route et guide utilisateur

SkillsVote : Gouvernance du cycle de vie des compétences des agents, de la collecte et de la recommandation à l'évolution

Lance : Modélisation multimodale unifiée par synergie multi-tâches

LongLive-2.0 : Une infrastructure parallèle NVFP4 pour la génération de vidéos longues

Découpage et Analyse Fine : Configuration de Mélanges Optimaux d'Experts

Découverte Agentique des Architectures Neurales : AIRA-Compose et AIRA-Design

Apprendre à prévoir : Révéler l'efficacité de déverrouillage de la distillation sur politique

DexJoCo : une plateforme d'évaluation et une boîte à outils pour la manipulation déxtere orientée tâche sur MuJoCo

FashionChameleon : Vers une personnalisation vidéo en temps réel et interactive des vêtements humains

CiteVQA : Évaluation de l'attribution des preuves pour une intelligence documentaire fiable

MMSkills : Vers des compétences multimodales pour des agents visuels généraux

PhysBrain 1.0 Rapport technique

Ramenation des modèles de valeur : critiques génératives pour la modélisation de la valeur dans l’apprentissage par renforcement des LLM

NEXUS : Un cadre agentic pour la prévision des séries temporelles

MemEye : Un cadre d'évaluation visuo-centré pour la mémoire des agents multimodaux

SANA-WM : Modélisation du monde efficace à l'échelle de la minute avec un Transformateur de Diffusion Linéaire Hybride

MemLens : Évaluation des modèles de vision-langage à grande échelle pour la mémoire multimodale à long terme

Apprentissage par renforcement agentique auto-distillé

Forçage causal++ : distillation de diffusion autoregressive à quelques étapes évolutive pour la génération vidéo interactive en temps réel

Obtenir un niveau de raisonnement olympique de médaille d'or via une mise à l'échelle simple et unifiée

RepoZero : Les LLMs peuvent-ils générer un dépôt de code à partir de zéro ?

Rapport technique Qwen-Image-VAE-2.0

Prédire les décisions des agents d'IA à partir d'interactions limitées par la modélisation textuelle et tabulaire