HyperAI

Principal

GPU

Console
Docs
Tarifs

Pulse

Actualités

Ressources

Publications de recherche
Notebooks
Jeux de données
Wiki

Benchmarks

SOTA
Modèles LLM
Classement des GPU

Communauté

Événements

Utilitaires

À propos Conditions d’utilisation Politique de confidentialité
Français

Command Palette

Search for a command to run...

HyperAI
Papers

Papers

Articles de recherche en IA de pointe mis à jour quotidiennement pour vous aider à suivre les dernières tendances en IA

Construire l’avenir de l’intelligence artificielle

À propos

À propos Aide relative au jeu de données

Produits

Actualités Notebooks Jeux de données Wiki

Liens

© HyperAI

GitHub Discord X (formerly Twitter)

HyperAI

Principal

GPU

Console
Docs
Tarifs

Pulse

Actualités

Ressources

Publications de recherche
Notebooks
Jeux de données
Wiki

Benchmarks

SOTA
Modèles LLM
Classement des GPU

Communauté

Événements

Utilitaires

À propos Conditions d’utilisation Politique de confidentialité
Français

Command Palette

Search for a command to run...

HyperAI
Papers

Papers

Articles de recherche en IA de pointe mis à jour quotidiennement pour vous aider à suivre les dernières tendances en IA

Construire l’avenir de l’intelligence artificielle

À propos

À propos Aide relative au jeu de données

Produits

Actualités Notebooks Jeux de données Wiki

Liens

© HyperAI

GitHub Discord X (formerly Twitter)

Vers une recherche mathématique autonome

Vers une recherche mathématique autonome

Tony Feng, Trieu H. Trinh, Garrett Bingham, et al.

Quand mémoriser et quand s’arrêter : une mémoire récurrente à grille pour le raisonnement à longue portée

Quand mémoriser et quand s’arrêter : une mémoire récurrente à grille pour le raisonnement à longue portée

Réponse Aux Questions Intelligente

Leheng Sheng, Yongtao Zhang, Wenchang Ma, et al.

ASA : Pilotage de l'activation pour l'adaptation de domaine de appel d'outils

ASA : Pilotage de l'activation pour l'adaptation de domaine de appel d'outils

Réponse Aux Questions Intelligente

Youjin Wang, Run Zhou, Rong Fu, et al.

PhyCritic : Modèles critiques multimodaux pour l'intelligence artificielle physique

PhyCritic : Modèles critiques multimodaux pour l'intelligence artificielle physique

Réponse À Des Questions Visuelles

Tianyi Xiong, Shihao Wang, Guilin Liu, et al.

GENIUS : Suite d'évaluation de l'intelligence fluide générative

GENIUS : Suite d'évaluation de l'intelligence fluide générative

Ruichuan An, Sihan Yang, Ziyu Guo, et al.

Étape 3,5 Flash : Ouvrir l'intelligence de niveau frontière avec 11 milliards de paramètres actifs

Étape 3,5 Flash : Ouvrir l'intelligence de niveau frontière avec 11 milliards de paramètres actifs

Entraînement Du Modèle

Ailin Huang, Ang Li, Aobo Kong, et al.

World-VLA-Loop : Apprentissage en boucle fermée du modèle mondial vidéo et de la politique VLA

World-VLA-Loop : Apprentissage en boucle fermée du modèle mondial vidéo et de la politique VLA

Modèle De Diffusion

Génération De Vidéo

Xiaokang Liu, Zechen Bai, Hai Ci, et al.

Vers une recherche mathématique autonome

Vers une recherche mathématique autonome

Génération Augmentée Par La Recherche

Tony Feng, Trieu H. Trinh, Garrett Bingham, et al.

Modèle mondial d'Agent : environnements synthétiques infinis pour l'apprentissage par renforcement agencé

Modèle mondial d'Agent : environnements synthétiques infinis pour l'apprentissage par renforcement agencé

Zhaoyang Wang, Canwen Xu, Boyi Liu, et al.

P1-VL : Surmonter le fossé entre la perception visuelle et le raisonnement scientifique dans les Olympiades de physique

P1-VL : Surmonter le fossé entre la perception visuelle et le raisonnement scientifique dans les Olympiades de physique

Représentation Multimodale

Yun Luo, Futing Wang, Qianjia Cheng, et al.

Chaîne de Mentalité : Raisonnement avec des Modes Cognitifs Adaptatifs

Chaîne de Mentalité : Raisonnement avec des Modes Cognitifs Adaptatifs

Tianyi Jiang, Arctanx An, Hengyi Feng, et al.

Rapport technique UI-Venus-1.5

Rapport technique UI-Venus-1.5

Veuns-Team, Changlong Gao, Zhangxuan Gu, et al.

Code2World : un modèle de monde GUI basé sur la génération de code rendu

Code2World : un modèle de monde GUI basé sur la génération de code rendu

Génération De Code

Yuhao Zheng, Li'an Zhong, Yi Wang, et al.

OPUS : Vers une sélection de données efficace et fondée sur des principes lors de l'entraînement préalable des grands modèles linguistiques à chaque itération

OPUS : Vers une sélection de données efficace et fondée sur des principes lors de l'entraînement préalable des grands modèles linguistiques à chaque itération

Shaobo Wang, Xuan Ouyang, Tianyi Xu, et al.

BagelVLA : Amélioration de la manipulation à horizon long grâce à la génération imbriquée vision-langage-action

BagelVLA : Amélioration de la manipulation à horizon long grâce à la génération imbriquée vision-langage-action

Yucheng Hu, Jianke Zhang, Yuanfei Luo, et al.

THINGS-data, une collection multimodale de jeux de données à grande échelle pour l'étude des représentations des objets dans le cerveau humain et le comportement

THINGS-data, une collection multimodale de jeux de données à grande échelle pour l'étude des représentations des objets dans le cerveau humain et le comportement

Représentation Multimodale

Jeu De Données

Martin N Hebart Oliver Contier, Lina Teichmann, Adam H Rockter, et al.

Prédictions précises de nouvelles interactions biomoléculaires avec IsoDDE

Prédictions précises de nouvelles interactions biomoléculaires avec IsoDDE

Apprentissage Profond

IA Pour La Science

Isomorphic Labs Team

SkillRL : Agents évolutifs par apprentissage par renforcement augmenté par des compétences récursives

SkillRL : Agents évolutifs par apprentissage par renforcement augmenté par des compétences récursives

Apprentissage Par Renforcement

Peng Xia, Jianwen Chen, Hanyang Wang, et al.

LLaDA2.1 : Accélération de la diffusion de texte par édition de tokens

LLaDA2.1 : Accélération de la diffusion de texte par édition de tokens

Modèle De Diffusion

Tiwei Bie, Maosong Cao, Xiang Cao, et al.

Atténuation des récompenses rares par modélisation des effets d’échantillonnage étape-par-étape et à long terme dans le GRPO fondé sur les flux

Atténuation des récompenses rares par modélisation des effets d’échantillonnage étape-par-étape et à long terme dans le GRPO fondé sur les flux

Modèle De Diffusion

Génération D'images

Yunze Tong, Mushui Liu, Canyu Zhao, et al.

Recurrent-Depth VLA : Échelle implicite du calcul en temps de test des modèles vision-langage-action par raisonnement itératif latent

Recurrent-Depth VLA : Échelle implicite du calcul en temps de test des modèles vision-langage-action par raisonnement itératif latent

Yalcin Tur, Jalal Naghiyev, Haoquan Fang, et al.

QuantaAlpha : Un cadre évolutif pour l’extraction d’alpha pilotée par LLM

QuantaAlpha : Un cadre évolutif pour l’extraction d’alpha pilotée par LLM

Jun Han, Shuo Zhang, Wei Li, et al.

Paradigme d'entraînement par alignement de sous-espaces piloté par l'écart de modalité pour les modèles linguistiques à grande échelle multimodaux

Paradigme d'entraînement par alignement de sous-espaces piloté par l'écart de modalité pour les modèles linguistiques à grande échelle multimodaux

Représentation Multimodale

Xiaomin Yu, Yi Xin, Wenjie Zhang, et al.

MOVA : Vers une génération vidéo-audio évolutif et synchronisé

MOVA : Vers une génération vidéo-audio évolutif et synchronisé

Génération De Vidéo

SII-OpenMOSS Team, Donghua Yu, Mingshu Chen, et al.

MemoryLLM : Mémoire à alimentation directe interprétable plug-and-play pour les transformateurs

MemoryLLM : Mémoire à alimentation directe interprétable plug-and-play pour les transformateurs

Ajay Jaiswal, Lauren Hannah, Han-Byul Kim, et al.

DreamDojo : un modèle mondial robotique généraliste issu de vidéos humaines à grande échelle

DreamDojo : un modèle mondial robotique généraliste issu de vidéos humaines à grande échelle

Compréhension Vidéo

Shenyuan Gao, William Liang, Kaiyuan Zheng, et al.

F-GRPO : Ne laissez pas votre politique apprendre ce qui est évident et oublier le rare

F-GRPO : Ne laissez pas votre politique apprendre ce qui est évident et oublier le rare

Apprentissage Par Renforcement

Daniil Plyusov, Alexey Gorbatovski, Boris Shaposhnikov, et al.

MSign : Un optimiseur prévenant l’instabilité d’entraînement dans les grands modèles linguistiques grâce à la restauration du rang stable

MSign : Un optimiseur prévenant l’instabilité d’entraînement dans les grands modèles linguistiques grâce à la restauration du rang stable

Entraînement Du Modèle

Lianhai Ren, Yucheng Ding, Xiao Liu, et al.

AudioSAE : Vers une compréhension des modèles de traitement audio à l’aide d’auto-encodeurs creux

AudioSAE : Vers une compréhension des modèles de traitement audio à l’aide d’auto-encodeurs creux

Traitement Audio Et Vocal

Apprentissage Profond

Georgii Aparin, Tasnima Sadekova, Alexey Rukhovich, et al.

Sur la dynamique de l'entropie dans le fine-tuning par renforcement des grands modèles linguistiques

Sur la dynamique de l'entropie dans le fine-tuning par renforcement des grands modèles linguistiques

Apprentissage Par Renforcement

Shumin Wang, Yuexiang Xie, Wenhao Zhang, et al.

OdysseyArena : Évaluation des grands modèles linguistiques pour des interactions longue portée, actives et inductives

OdysseyArena : Évaluation des grands modèles linguistiques pour des interactions longue portée, actives et inductives

Fangzhi Xu, Hang Yan, Qiushi Sun, et al.

Baichuan-M3 : Modélisation de l'interrogatoire clinique pour une prise de décision médicale fiable

Baichuan-M3 : Modélisation de l'interrogatoire clinique pour une prise de décision médicale fiable

Baichuan-M3 Team, Chengfeng Dou, Fan Yang, et al.

Vers une recherche mathématique autonome

Vers une recherche mathématique autonome

Tony Feng, Trieu H. Trinh, Garrett Bingham, et al.

Quand mémoriser et quand s’arrêter : une mémoire récurrente à grille pour le raisonnement à longue portée

Quand mémoriser et quand s’arrêter : une mémoire récurrente à grille pour le raisonnement à longue portée

Réponse Aux Questions Intelligente

Leheng Sheng, Yongtao Zhang, Wenchang Ma, et al.

ASA : Pilotage de l'activation pour l'adaptation de domaine de appel d'outils

ASA : Pilotage de l'activation pour l'adaptation de domaine de appel d'outils

Réponse Aux Questions Intelligente

Youjin Wang, Run Zhou, Rong Fu, et al.

PhyCritic : Modèles critiques multimodaux pour l'intelligence artificielle physique

PhyCritic : Modèles critiques multimodaux pour l'intelligence artificielle physique

Réponse À Des Questions Visuelles

Tianyi Xiong, Shihao Wang, Guilin Liu, et al.

GENIUS : Suite d'évaluation de l'intelligence fluide générative

GENIUS : Suite d'évaluation de l'intelligence fluide générative

Ruichuan An, Sihan Yang, Ziyu Guo, et al.

Étape 3,5 Flash : Ouvrir l'intelligence de niveau frontière avec 11 milliards de paramètres actifs

Étape 3,5 Flash : Ouvrir l'intelligence de niveau frontière avec 11 milliards de paramètres actifs

Entraînement Du Modèle

Ailin Huang, Ang Li, Aobo Kong, et al.

World-VLA-Loop : Apprentissage en boucle fermée du modèle mondial vidéo et de la politique VLA

World-VLA-Loop : Apprentissage en boucle fermée du modèle mondial vidéo et de la politique VLA

Modèle De Diffusion

Génération De Vidéo

Xiaokang Liu, Zechen Bai, Hai Ci, et al.

Vers une recherche mathématique autonome

Vers une recherche mathématique autonome

Génération Augmentée Par La Recherche

Tony Feng, Trieu H. Trinh, Garrett Bingham, et al.

Modèle mondial d'Agent : environnements synthétiques infinis pour l'apprentissage par renforcement agencé

Modèle mondial d'Agent : environnements synthétiques infinis pour l'apprentissage par renforcement agencé

Zhaoyang Wang, Canwen Xu, Boyi Liu, et al.

P1-VL : Surmonter le fossé entre la perception visuelle et le raisonnement scientifique dans les Olympiades de physique

P1-VL : Surmonter le fossé entre la perception visuelle et le raisonnement scientifique dans les Olympiades de physique

Représentation Multimodale

Yun Luo, Futing Wang, Qianjia Cheng, et al.

Chaîne de Mentalité : Raisonnement avec des Modes Cognitifs Adaptatifs

Chaîne de Mentalité : Raisonnement avec des Modes Cognitifs Adaptatifs

Tianyi Jiang, Arctanx An, Hengyi Feng, et al.

Rapport technique UI-Venus-1.5

Rapport technique UI-Venus-1.5

Veuns-Team, Changlong Gao, Zhangxuan Gu, et al.

Code2World : un modèle de monde GUI basé sur la génération de code rendu

Code2World : un modèle de monde GUI basé sur la génération de code rendu

Génération De Code

Yuhao Zheng, Li'an Zhong, Yi Wang, et al.

OPUS : Vers une sélection de données efficace et fondée sur des principes lors de l'entraînement préalable des grands modèles linguistiques à chaque itération

OPUS : Vers une sélection de données efficace et fondée sur des principes lors de l'entraînement préalable des grands modèles linguistiques à chaque itération

Shaobo Wang, Xuan Ouyang, Tianyi Xu, et al.

BagelVLA : Amélioration de la manipulation à horizon long grâce à la génération imbriquée vision-langage-action

BagelVLA : Amélioration de la manipulation à horizon long grâce à la génération imbriquée vision-langage-action

Yucheng Hu, Jianke Zhang, Yuanfei Luo, et al.

THINGS-data, une collection multimodale de jeux de données à grande échelle pour l'étude des représentations des objets dans le cerveau humain et le comportement

THINGS-data, une collection multimodale de jeux de données à grande échelle pour l'étude des représentations des objets dans le cerveau humain et le comportement

Représentation Multimodale

Jeu De Données

Martin N Hebart Oliver Contier, Lina Teichmann, Adam H Rockter, et al.

Prédictions précises de nouvelles interactions biomoléculaires avec IsoDDE

Prédictions précises de nouvelles interactions biomoléculaires avec IsoDDE

Apprentissage Profond

IA Pour La Science

Isomorphic Labs Team

SkillRL : Agents évolutifs par apprentissage par renforcement augmenté par des compétences récursives

SkillRL : Agents évolutifs par apprentissage par renforcement augmenté par des compétences récursives

Apprentissage Par Renforcement

Peng Xia, Jianwen Chen, Hanyang Wang, et al.

LLaDA2.1 : Accélération de la diffusion de texte par édition de tokens

LLaDA2.1 : Accélération de la diffusion de texte par édition de tokens

Modèle De Diffusion

Tiwei Bie, Maosong Cao, Xiang Cao, et al.

Atténuation des récompenses rares par modélisation des effets d’échantillonnage étape-par-étape et à long terme dans le GRPO fondé sur les flux

Atténuation des récompenses rares par modélisation des effets d’échantillonnage étape-par-étape et à long terme dans le GRPO fondé sur les flux

Modèle De Diffusion

Génération D'images

Yunze Tong, Mushui Liu, Canyu Zhao, et al.

Recurrent-Depth VLA : Échelle implicite du calcul en temps de test des modèles vision-langage-action par raisonnement itératif latent

Recurrent-Depth VLA : Échelle implicite du calcul en temps de test des modèles vision-langage-action par raisonnement itératif latent

Yalcin Tur, Jalal Naghiyev, Haoquan Fang, et al.

QuantaAlpha : Un cadre évolutif pour l’extraction d’alpha pilotée par LLM

QuantaAlpha : Un cadre évolutif pour l’extraction d’alpha pilotée par LLM

Jun Han, Shuo Zhang, Wei Li, et al.

Paradigme d'entraînement par alignement de sous-espaces piloté par l'écart de modalité pour les modèles linguistiques à grande échelle multimodaux

Paradigme d'entraînement par alignement de sous-espaces piloté par l'écart de modalité pour les modèles linguistiques à grande échelle multimodaux

Représentation Multimodale

Xiaomin Yu, Yi Xin, Wenjie Zhang, et al.

MOVA : Vers une génération vidéo-audio évolutif et synchronisé

MOVA : Vers une génération vidéo-audio évolutif et synchronisé

Génération De Vidéo

SII-OpenMOSS Team, Donghua Yu, Mingshu Chen, et al.

MemoryLLM : Mémoire à alimentation directe interprétable plug-and-play pour les transformateurs

MemoryLLM : Mémoire à alimentation directe interprétable plug-and-play pour les transformateurs

Ajay Jaiswal, Lauren Hannah, Han-Byul Kim, et al.

DreamDojo : un modèle mondial robotique généraliste issu de vidéos humaines à grande échelle

DreamDojo : un modèle mondial robotique généraliste issu de vidéos humaines à grande échelle

Compréhension Vidéo

Shenyuan Gao, William Liang, Kaiyuan Zheng, et al.

F-GRPO : Ne laissez pas votre politique apprendre ce qui est évident et oublier le rare

F-GRPO : Ne laissez pas votre politique apprendre ce qui est évident et oublier le rare

Apprentissage Par Renforcement

Daniil Plyusov, Alexey Gorbatovski, Boris Shaposhnikov, et al.

MSign : Un optimiseur prévenant l’instabilité d’entraînement dans les grands modèles linguistiques grâce à la restauration du rang stable

MSign : Un optimiseur prévenant l’instabilité d’entraînement dans les grands modèles linguistiques grâce à la restauration du rang stable

Entraînement Du Modèle

Lianhai Ren, Yucheng Ding, Xiao Liu, et al.

AudioSAE : Vers une compréhension des modèles de traitement audio à l’aide d’auto-encodeurs creux

AudioSAE : Vers une compréhension des modèles de traitement audio à l’aide d’auto-encodeurs creux

Traitement Audio Et Vocal

Apprentissage Profond

Georgii Aparin, Tasnima Sadekova, Alexey Rukhovich, et al.

Sur la dynamique de l'entropie dans le fine-tuning par renforcement des grands modèles linguistiques

Sur la dynamique de l'entropie dans le fine-tuning par renforcement des grands modèles linguistiques

Apprentissage Par Renforcement

Shumin Wang, Yuexiang Xie, Wenhao Zhang, et al.

OdysseyArena : Évaluation des grands modèles linguistiques pour des interactions longue portée, actives et inductives

OdysseyArena : Évaluation des grands modèles linguistiques pour des interactions longue portée, actives et inductives

Fangzhi Xu, Hang Yan, Qiushi Sun, et al.

Baichuan-M3 : Modélisation de l'interrogatoire clinique pour une prise de décision médicale fiable

Baichuan-M3 : Modélisation de l'interrogatoire clinique pour une prise de décision médicale fiable

Baichuan-M3 Team, Chengfeng Dou, Fan Yang, et al.