HyperAI

Principal

GPU

Console
Docs
Tarifs

Pulse

Actualités

Ressources

Publications de recherche
Notebooks
Jeux de données
Wiki

Benchmarks

SOTA
Modèles LLM
Classement des GPU

Communauté

Événements

Utilitaires

À propos Conditions d’utilisation Politique de confidentialité
Français

Command Palette

Search for a command to run...

HyperAI
Papers

Papers

Articles de recherche en IA de pointe mis à jour quotidiennement pour vous aider à suivre les dernières tendances en IA

Construire l’avenir de l’intelligence artificielle

À propos

À propos Aide relative au jeu de données

Produits

Actualités Notebooks Jeux de données Wiki

Liens

© HyperAI

GitHub Discord X (formerly Twitter)

HyperAI

Principal

GPU

Console
Docs
Tarifs

Pulse

Actualités

Ressources

Publications de recherche
Notebooks
Jeux de données
Wiki

Benchmarks

SOTA
Modèles LLM
Classement des GPU

Communauté

Événements

Utilitaires

À propos Conditions d’utilisation Politique de confidentialité
Français

Command Palette

Search for a command to run...

HyperAI
Papers

Papers

Articles de recherche en IA de pointe mis à jour quotidiennement pour vous aider à suivre les dernières tendances en IA

Construire l’avenir de l’intelligence artificielle

À propos

À propos Aide relative au jeu de données

Produits

Actualités Notebooks Jeux de données Wiki

Liens

© HyperAI

GitHub Discord X (formerly Twitter)

Modèle mondial d'Agent : environnements synthétiques infinis pour l'apprentissage par renforcement agencé

Modèle mondial d'Agent : environnements synthétiques infinis pour l'apprentissage par renforcement agencé

Zhaoyang Wang, Canwen Xu, Boyi Liu, et al.

P1-VL : Surmonter le fossé entre la perception visuelle et le raisonnement scientifique dans les Olympiades de physique

P1-VL : Surmonter le fossé entre la perception visuelle et le raisonnement scientifique dans les Olympiades de physique

Représentation Multimodale

Yun Luo, Futing Wang, Qianjia Cheng, et al.

Chaîne de Mentalité : Raisonnement avec des Modes Cognitifs Adaptatifs

Chaîne de Mentalité : Raisonnement avec des Modes Cognitifs Adaptatifs

Tianyi Jiang, Arctanx An, Hengyi Feng, et al.

Rapport technique UI-Venus-1.5

Rapport technique UI-Venus-1.5

Veuns-Team, Changlong Gao, Zhangxuan Gu, et al.

Code2World : un modèle de monde GUI basé sur la génération de code rendu

Code2World : un modèle de monde GUI basé sur la génération de code rendu

Génération De Code

Yuhao Zheng, Li'an Zhong, Yi Wang, et al.

OPUS : Vers une sélection de données efficace et fondée sur des principes lors de l'entraînement préalable des grands modèles linguistiques à chaque itération

OPUS : Vers une sélection de données efficace et fondée sur des principes lors de l'entraînement préalable des grands modèles linguistiques à chaque itération

Shaobo Wang, Xuan Ouyang, Tianyi Xu, et al.

BagelVLA : Amélioration de la manipulation à horizon long grâce à la génération imbriquée vision-langage-action

BagelVLA : Amélioration de la manipulation à horizon long grâce à la génération imbriquée vision-langage-action

Yucheng Hu, Jianke Zhang, Yuanfei Luo, et al.

THINGS-data, une collection multimodale de jeux de données à grande échelle pour l'étude des représentations des objets dans le cerveau humain et le comportement

THINGS-data, une collection multimodale de jeux de données à grande échelle pour l'étude des représentations des objets dans le cerveau humain et le comportement

Représentation Multimodale

Jeu De Données

Martin N Hebart Oliver Contier, Lina Teichmann, Adam H Rockter, et al.

Prédictions précises de nouvelles interactions biomoléculaires avec IsoDDE

Prédictions précises de nouvelles interactions biomoléculaires avec IsoDDE

Apprentissage Profond

IA Pour La Science

Isomorphic Labs Team

SkillRL : Agents évolutifs par apprentissage par renforcement augmenté par des compétences récursives

SkillRL : Agents évolutifs par apprentissage par renforcement augmenté par des compétences récursives

Apprentissage Par Renforcement

Peng Xia, Jianwen Chen, Hanyang Wang, et al.

LLaDA2.1 : Accélération de la diffusion de texte par édition de tokens

LLaDA2.1 : Accélération de la diffusion de texte par édition de tokens

Modèle De Diffusion

Tiwei Bie, Maosong Cao, Xiang Cao, et al.

Atténuation des récompenses rares par modélisation des effets d’échantillonnage étape-par-étape et à long terme dans le GRPO fondé sur les flux

Atténuation des récompenses rares par modélisation des effets d’échantillonnage étape-par-étape et à long terme dans le GRPO fondé sur les flux

Modèle De Diffusion

Génération D'images

Yunze Tong, Mushui Liu, Canyu Zhao, et al.

Recurrent-Depth VLA : Échelle implicite du calcul en temps de test des modèles vision-langage-action par raisonnement itératif latent

Recurrent-Depth VLA : Échelle implicite du calcul en temps de test des modèles vision-langage-action par raisonnement itératif latent

Yalcin Tur, Jalal Naghiyev, Haoquan Fang, et al.

QuantaAlpha : Un cadre évolutif pour l’extraction d’alpha pilotée par LLM

QuantaAlpha : Un cadre évolutif pour l’extraction d’alpha pilotée par LLM

Jun Han, Shuo Zhang, Wei Li, et al.

Paradigme d'entraînement par alignement de sous-espaces piloté par l'écart de modalité pour les modèles linguistiques à grande échelle multimodaux

Paradigme d'entraînement par alignement de sous-espaces piloté par l'écart de modalité pour les modèles linguistiques à grande échelle multimodaux

Représentation Multimodale

Xiaomin Yu, Yi Xin, Wenjie Zhang, et al.

MOVA : Vers une génération vidéo-audio évolutif et synchronisé

MOVA : Vers une génération vidéo-audio évolutif et synchronisé

Génération De Vidéo

SII-OpenMOSS Team, Donghua Yu, Mingshu Chen, et al.

MemoryLLM : Mémoire à alimentation directe interprétable plug-and-play pour les transformateurs

MemoryLLM : Mémoire à alimentation directe interprétable plug-and-play pour les transformateurs

Ajay Jaiswal, Lauren Hannah, Han-Byul Kim, et al.

DreamDojo : un modèle mondial robotique généraliste issu de vidéos humaines à grande échelle

DreamDojo : un modèle mondial robotique généraliste issu de vidéos humaines à grande échelle

Compréhension Vidéo

Shenyuan Gao, William Liang, Kaiyuan Zheng, et al.

F-GRPO : Ne laissez pas votre politique apprendre ce qui est évident et oublier le rare

F-GRPO : Ne laissez pas votre politique apprendre ce qui est évident et oublier le rare

Apprentissage Par Renforcement

Daniil Plyusov, Alexey Gorbatovski, Boris Shaposhnikov, et al.

MSign : Un optimiseur prévenant l’instabilité d’entraînement dans les grands modèles linguistiques grâce à la restauration du rang stable

MSign : Un optimiseur prévenant l’instabilité d’entraînement dans les grands modèles linguistiques grâce à la restauration du rang stable

Entraînement Du Modèle

Lianhai Ren, Yucheng Ding, Xiao Liu, et al.

AudioSAE : Vers une compréhension des modèles de traitement audio à l’aide d’auto-encodeurs creux

AudioSAE : Vers une compréhension des modèles de traitement audio à l’aide d’auto-encodeurs creux

Traitement Audio Et Vocal

Apprentissage Profond

Georgii Aparin, Tasnima Sadekova, Alexey Rukhovich, et al.

Sur la dynamique de l'entropie dans le fine-tuning par renforcement des grands modèles linguistiques

Sur la dynamique de l'entropie dans le fine-tuning par renforcement des grands modèles linguistiques

Apprentissage Par Renforcement

Shumin Wang, Yuexiang Xie, Wenhao Zhang, et al.

OdysseyArena : Évaluation des grands modèles linguistiques pour des interactions longue portée, actives et inductives

OdysseyArena : Évaluation des grands modèles linguistiques pour des interactions longue portée, actives et inductives

Fangzhi Xu, Hang Yan, Qiushi Sun, et al.

Baichuan-M3 : Modélisation de l'interrogatoire clinique pour une prise de décision médicale fiable

Baichuan-M3 : Modélisation de l'interrogatoire clinique pour une prise de décision médicale fiable

Baichuan-M3 Team, Chengfeng Dou, Fan Yang, et al.

Modélisation générative par dérive

Modélisation générative par dérive

Modèle De Diffusion

Génération D'images

Mingyang Deng, He Li, Tianhong Li, Kaiming He

AlphaEdit : Édition de connaissances contrainte par espace nul pour les modèles de langage

AlphaEdit : Édition de connaissances contrainte par espace nul pour les modèles de langage

Génération De Texte

Junfeng Fang, Houcheng Jiang, Kun Wang, et al.

Apprendre à raisonner en 13 paramètres

Apprendre à raisonner en 13 paramètres

Réponse Aux Questions Intelligente

John X. Morris, Niloofar Mireshghallah, Mark Ibrahim, et al.

DFlash : Diffusion par blocs pour le décodage spéculatif Flash

DFlash : Diffusion par blocs pour le décodage spéculatif Flash

Modèle De Diffusion

Jian Chen, Yesheng Liang, Zhijian Liu

Forçage de contexte : génération vidéo autoregressive cohérente avec un long contexte

Forçage de contexte : génération vidéo autoregressive cohérente avec un long contexte

Génération De Vidéo

Modèle De Diffusion

Shuo Chen, Cong Wei, Sun Sun, et al.

MemSkill : Apprentissage et évolution de compétences mémoire pour des agents auto-évoluant

MemSkill : Apprentissage et évolution de compétences mémoire pour des agents auto-évoluant

Haozhen Zhang, Quanyu Long, Jianzhu Bao, et al.

Optimisation de politique de séquence sans biais de longueur : Révélation et contrôle de la variation de longueur des réponses dans le cadre du RLVR

Optimisation de politique de séquence sans biais de longueur : Révélation et contrôle de la variation de longueur des réponses dans le cadre du RLVR

Apprentissage Par Renforcement

Fanfan Liu, Youyang Yin, Peng Shi, et al.

Spider-Sense : Détection intrinsèque des risques pour une défense d'Agent efficace basée sur un tri hiérarchique adaptatif

Spider-Sense : Détection intrinsèque des risques pour une défense d'Agent efficace basée sur un tri hiérarchique adaptatif

Zhenxiong Yu, Zhi Yang, Zhiheng Jin, et al.

Modèle mondial d'Agent : environnements synthétiques infinis pour l'apprentissage par renforcement agencé

Modèle mondial d'Agent : environnements synthétiques infinis pour l'apprentissage par renforcement agencé

Zhaoyang Wang, Canwen Xu, Boyi Liu, et al.

P1-VL : Surmonter le fossé entre la perception visuelle et le raisonnement scientifique dans les Olympiades de physique

P1-VL : Surmonter le fossé entre la perception visuelle et le raisonnement scientifique dans les Olympiades de physique

Représentation Multimodale

Yun Luo, Futing Wang, Qianjia Cheng, et al.

Chaîne de Mentalité : Raisonnement avec des Modes Cognitifs Adaptatifs

Chaîne de Mentalité : Raisonnement avec des Modes Cognitifs Adaptatifs

Tianyi Jiang, Arctanx An, Hengyi Feng, et al.

Rapport technique UI-Venus-1.5

Rapport technique UI-Venus-1.5

Veuns-Team, Changlong Gao, Zhangxuan Gu, et al.

Code2World : un modèle de monde GUI basé sur la génération de code rendu

Code2World : un modèle de monde GUI basé sur la génération de code rendu

Génération De Code

Yuhao Zheng, Li'an Zhong, Yi Wang, et al.

OPUS : Vers une sélection de données efficace et fondée sur des principes lors de l'entraînement préalable des grands modèles linguistiques à chaque itération

OPUS : Vers une sélection de données efficace et fondée sur des principes lors de l'entraînement préalable des grands modèles linguistiques à chaque itération

Shaobo Wang, Xuan Ouyang, Tianyi Xu, et al.

BagelVLA : Amélioration de la manipulation à horizon long grâce à la génération imbriquée vision-langage-action

BagelVLA : Amélioration de la manipulation à horizon long grâce à la génération imbriquée vision-langage-action

Yucheng Hu, Jianke Zhang, Yuanfei Luo, et al.

THINGS-data, une collection multimodale de jeux de données à grande échelle pour l'étude des représentations des objets dans le cerveau humain et le comportement

THINGS-data, une collection multimodale de jeux de données à grande échelle pour l'étude des représentations des objets dans le cerveau humain et le comportement

Représentation Multimodale

Jeu De Données

Martin N Hebart Oliver Contier, Lina Teichmann, Adam H Rockter, et al.

Prédictions précises de nouvelles interactions biomoléculaires avec IsoDDE

Prédictions précises de nouvelles interactions biomoléculaires avec IsoDDE

Apprentissage Profond

IA Pour La Science

Isomorphic Labs Team

SkillRL : Agents évolutifs par apprentissage par renforcement augmenté par des compétences récursives

SkillRL : Agents évolutifs par apprentissage par renforcement augmenté par des compétences récursives

Apprentissage Par Renforcement

Peng Xia, Jianwen Chen, Hanyang Wang, et al.

LLaDA2.1 : Accélération de la diffusion de texte par édition de tokens

LLaDA2.1 : Accélération de la diffusion de texte par édition de tokens

Modèle De Diffusion

Tiwei Bie, Maosong Cao, Xiang Cao, et al.

Atténuation des récompenses rares par modélisation des effets d’échantillonnage étape-par-étape et à long terme dans le GRPO fondé sur les flux

Atténuation des récompenses rares par modélisation des effets d’échantillonnage étape-par-étape et à long terme dans le GRPO fondé sur les flux

Modèle De Diffusion

Génération D'images

Yunze Tong, Mushui Liu, Canyu Zhao, et al.

Recurrent-Depth VLA : Échelle implicite du calcul en temps de test des modèles vision-langage-action par raisonnement itératif latent

Recurrent-Depth VLA : Échelle implicite du calcul en temps de test des modèles vision-langage-action par raisonnement itératif latent

Yalcin Tur, Jalal Naghiyev, Haoquan Fang, et al.

QuantaAlpha : Un cadre évolutif pour l’extraction d’alpha pilotée par LLM

QuantaAlpha : Un cadre évolutif pour l’extraction d’alpha pilotée par LLM

Jun Han, Shuo Zhang, Wei Li, et al.

Paradigme d'entraînement par alignement de sous-espaces piloté par l'écart de modalité pour les modèles linguistiques à grande échelle multimodaux

Paradigme d'entraînement par alignement de sous-espaces piloté par l'écart de modalité pour les modèles linguistiques à grande échelle multimodaux

Représentation Multimodale

Xiaomin Yu, Yi Xin, Wenjie Zhang, et al.

MOVA : Vers une génération vidéo-audio évolutif et synchronisé

MOVA : Vers une génération vidéo-audio évolutif et synchronisé

Génération De Vidéo

SII-OpenMOSS Team, Donghua Yu, Mingshu Chen, et al.

MemoryLLM : Mémoire à alimentation directe interprétable plug-and-play pour les transformateurs

MemoryLLM : Mémoire à alimentation directe interprétable plug-and-play pour les transformateurs

Ajay Jaiswal, Lauren Hannah, Han-Byul Kim, et al.

DreamDojo : un modèle mondial robotique généraliste issu de vidéos humaines à grande échelle

DreamDojo : un modèle mondial robotique généraliste issu de vidéos humaines à grande échelle

Compréhension Vidéo

Shenyuan Gao, William Liang, Kaiyuan Zheng, et al.

F-GRPO : Ne laissez pas votre politique apprendre ce qui est évident et oublier le rare

F-GRPO : Ne laissez pas votre politique apprendre ce qui est évident et oublier le rare

Apprentissage Par Renforcement

Daniil Plyusov, Alexey Gorbatovski, Boris Shaposhnikov, et al.

MSign : Un optimiseur prévenant l’instabilité d’entraînement dans les grands modèles linguistiques grâce à la restauration du rang stable

MSign : Un optimiseur prévenant l’instabilité d’entraînement dans les grands modèles linguistiques grâce à la restauration du rang stable

Entraînement Du Modèle

Lianhai Ren, Yucheng Ding, Xiao Liu, et al.

AudioSAE : Vers une compréhension des modèles de traitement audio à l’aide d’auto-encodeurs creux

AudioSAE : Vers une compréhension des modèles de traitement audio à l’aide d’auto-encodeurs creux

Traitement Audio Et Vocal

Apprentissage Profond

Georgii Aparin, Tasnima Sadekova, Alexey Rukhovich, et al.

Sur la dynamique de l'entropie dans le fine-tuning par renforcement des grands modèles linguistiques

Sur la dynamique de l'entropie dans le fine-tuning par renforcement des grands modèles linguistiques

Apprentissage Par Renforcement

Shumin Wang, Yuexiang Xie, Wenhao Zhang, et al.

OdysseyArena : Évaluation des grands modèles linguistiques pour des interactions longue portée, actives et inductives

OdysseyArena : Évaluation des grands modèles linguistiques pour des interactions longue portée, actives et inductives

Fangzhi Xu, Hang Yan, Qiushi Sun, et al.

Baichuan-M3 : Modélisation de l'interrogatoire clinique pour une prise de décision médicale fiable

Baichuan-M3 : Modélisation de l'interrogatoire clinique pour une prise de décision médicale fiable

Baichuan-M3 Team, Chengfeng Dou, Fan Yang, et al.

Modélisation générative par dérive

Modélisation générative par dérive

Modèle De Diffusion

Génération D'images

Mingyang Deng, He Li, Tianhong Li, Kaiming He

AlphaEdit : Édition de connaissances contrainte par espace nul pour les modèles de langage

AlphaEdit : Édition de connaissances contrainte par espace nul pour les modèles de langage

Génération De Texte

Junfeng Fang, Houcheng Jiang, Kun Wang, et al.

Apprendre à raisonner en 13 paramètres

Apprendre à raisonner en 13 paramètres

Réponse Aux Questions Intelligente

John X. Morris, Niloofar Mireshghallah, Mark Ibrahim, et al.

DFlash : Diffusion par blocs pour le décodage spéculatif Flash

DFlash : Diffusion par blocs pour le décodage spéculatif Flash

Modèle De Diffusion

Jian Chen, Yesheng Liang, Zhijian Liu

Forçage de contexte : génération vidéo autoregressive cohérente avec un long contexte

Forçage de contexte : génération vidéo autoregressive cohérente avec un long contexte

Génération De Vidéo

Modèle De Diffusion

Shuo Chen, Cong Wei, Sun Sun, et al.

MemSkill : Apprentissage et évolution de compétences mémoire pour des agents auto-évoluant

MemSkill : Apprentissage et évolution de compétences mémoire pour des agents auto-évoluant

Haozhen Zhang, Quanyu Long, Jianzhu Bao, et al.

Optimisation de politique de séquence sans biais de longueur : Révélation et contrôle de la variation de longueur des réponses dans le cadre du RLVR

Optimisation de politique de séquence sans biais de longueur : Révélation et contrôle de la variation de longueur des réponses dans le cadre du RLVR

Apprentissage Par Renforcement

Fanfan Liu, Youyang Yin, Peng Shi, et al.

Spider-Sense : Détection intrinsèque des risques pour une défense d'Agent efficace basée sur un tri hiérarchique adaptatif

Spider-Sense : Détection intrinsèque des risques pour une défense d'Agent efficace basée sur un tri hiérarchique adaptatif

Zhenxiong Yu, Zhi Yang, Zhiheng Jin, et al.