HyperAI

Principal

GPU

Console
Docs
Tarifs

Pulse

Actualités

Ressources

Publications de recherche
Notebooks
Jeux de données
Wiki

Benchmarks

SOTA
Modèles LLM
Classement des GPU

Communauté

Événements

Utilitaires

À propos Conditions d’utilisation Politique de confidentialité
Français

Command Palette

Search for a command to run...

HyperAI
Papers

Papers

Articles de recherche en IA de pointe mis à jour quotidiennement pour vous aider à suivre les dernières tendances en IA

Construire l’avenir de l’intelligence artificielle

À propos

À propos Aide relative au jeu de données

Produits

Actualités Notebooks Jeux de données Wiki

Liens

© HyperAI

GitHub Discord X (formerly Twitter)

HyperAI

Principal

GPU

Console
Docs
Tarifs

Pulse

Actualités

Ressources

Publications de recherche
Notebooks
Jeux de données
Wiki

Benchmarks

SOTA
Modèles LLM
Classement des GPU

Communauté

Événements

Utilitaires

À propos Conditions d’utilisation Politique de confidentialité
Français

Command Palette

Search for a command to run...

HyperAI
Papers

Papers

Articles de recherche en IA de pointe mis à jour quotidiennement pour vous aider à suivre les dernières tendances en IA

Construire l’avenir de l’intelligence artificielle

À propos

À propos Aide relative au jeu de données

Produits

Actualités Notebooks Jeux de données Wiki

Liens

© HyperAI

GitHub Discord X (formerly Twitter)

LLaDA2.1 : Accélération de la diffusion de texte par édition de tokens

LLaDA2.1 : Accélération de la diffusion de texte par édition de tokens

Modèle De Diffusion

Tiwei Bie, Maosong Cao, Xiang Cao, et al.

Atténuation des récompenses rares par modélisation des effets d’échantillonnage étape-par-étape et à long terme dans le GRPO fondé sur les flux

Atténuation des récompenses rares par modélisation des effets d’échantillonnage étape-par-étape et à long terme dans le GRPO fondé sur les flux

Modèle De Diffusion

Génération D'images

Yunze Tong, Mushui Liu, Canyu Zhao, et al.

Recurrent-Depth VLA : Échelle implicite du calcul en temps de test des modèles vision-langage-action par raisonnement itératif latent

Recurrent-Depth VLA : Échelle implicite du calcul en temps de test des modèles vision-langage-action par raisonnement itératif latent

Yalcin Tur, Jalal Naghiyev, Haoquan Fang, et al.

QuantaAlpha : Un cadre évolutif pour l’extraction d’alpha pilotée par LLM

QuantaAlpha : Un cadre évolutif pour l’extraction d’alpha pilotée par LLM

Jun Han, Shuo Zhang, Wei Li, et al.

Paradigme d'entraînement par alignement de sous-espaces piloté par l'écart de modalité pour les modèles linguistiques à grande échelle multimodaux

Paradigme d'entraînement par alignement de sous-espaces piloté par l'écart de modalité pour les modèles linguistiques à grande échelle multimodaux

Représentation Multimodale

Xiaomin Yu, Yi Xin, Wenjie Zhang, et al.

MOVA : Vers une génération vidéo-audio évolutif et synchronisé

MOVA : Vers une génération vidéo-audio évolutif et synchronisé

Génération De Vidéo

SII-OpenMOSS Team, Donghua Yu, Mingshu Chen, et al.

MemoryLLM : Mémoire à alimentation directe interprétable plug-and-play pour les transformateurs

MemoryLLM : Mémoire à alimentation directe interprétable plug-and-play pour les transformateurs

Ajay Jaiswal, Lauren Hannah, Han-Byul Kim, et al.

DreamDojo : un modèle mondial robotique généraliste issu de vidéos humaines à grande échelle

DreamDojo : un modèle mondial robotique généraliste issu de vidéos humaines à grande échelle

Compréhension Vidéo

Shenyuan Gao, William Liang, Kaiyuan Zheng, et al.

F-GRPO : Ne laissez pas votre politique apprendre ce qui est évident et oublier le rare

F-GRPO : Ne laissez pas votre politique apprendre ce qui est évident et oublier le rare

Apprentissage Par Renforcement

Daniil Plyusov, Alexey Gorbatovski, Boris Shaposhnikov, et al.

MSign : Un optimiseur prévenant l’instabilité d’entraînement dans les grands modèles linguistiques grâce à la restauration du rang stable

MSign : Un optimiseur prévenant l’instabilité d’entraînement dans les grands modèles linguistiques grâce à la restauration du rang stable

Entraînement Du Modèle

Lianhai Ren, Yucheng Ding, Xiao Liu, et al.

AudioSAE : Vers une compréhension des modèles de traitement audio à l’aide d’auto-encodeurs creux

AudioSAE : Vers une compréhension des modèles de traitement audio à l’aide d’auto-encodeurs creux

Traitement Audio Et Vocal

Apprentissage Profond

Georgii Aparin, Tasnima Sadekova, Alexey Rukhovich, et al.

Sur la dynamique de l'entropie dans le fine-tuning par renforcement des grands modèles linguistiques

Sur la dynamique de l'entropie dans le fine-tuning par renforcement des grands modèles linguistiques

Apprentissage Par Renforcement

Shumin Wang, Yuexiang Xie, Wenhao Zhang, et al.

OdysseyArena : Évaluation des grands modèles linguistiques pour des interactions longue portée, actives et inductives

OdysseyArena : Évaluation des grands modèles linguistiques pour des interactions longue portée, actives et inductives

Fangzhi Xu, Hang Yan, Qiushi Sun, et al.

Baichuan-M3 : Modélisation de l'interrogatoire clinique pour une prise de décision médicale fiable

Baichuan-M3 : Modélisation de l'interrogatoire clinique pour une prise de décision médicale fiable

Baichuan-M3 Team, Chengfeng Dou, Fan Yang, et al.

Modélisation générative par dérive

Modélisation générative par dérive

Modèle De Diffusion

Génération D'images

Mingyang Deng, He Li, Tianhong Li, Kaiming He

AlphaEdit : Édition de connaissances contrainte par espace nul pour les modèles de langage

AlphaEdit : Édition de connaissances contrainte par espace nul pour les modèles de langage

Génération De Texte

Junfeng Fang, Houcheng Jiang, Kun Wang, et al.

Apprendre à raisonner en 13 paramètres

Apprendre à raisonner en 13 paramètres

Réponse Aux Questions Intelligente

John X. Morris, Niloofar Mireshghallah, Mark Ibrahim, et al.

DFlash : Diffusion par blocs pour le décodage spéculatif Flash

DFlash : Diffusion par blocs pour le décodage spéculatif Flash

Modèle De Diffusion

Jian Chen, Yesheng Liang, Zhijian Liu

Forçage de contexte : génération vidéo autoregressive cohérente avec un long contexte

Forçage de contexte : génération vidéo autoregressive cohérente avec un long contexte

Génération De Vidéo

Modèle De Diffusion

Shuo Chen, Cong Wei, Sun Sun, et al.

MemSkill : Apprentissage et évolution de compétences mémoire pour des agents auto-évoluant

MemSkill : Apprentissage et évolution de compétences mémoire pour des agents auto-évoluant

Haozhen Zhang, Quanyu Long, Jianzhu Bao, et al.

Optimisation de politique de séquence sans biais de longueur : Révélation et contrôle de la variation de longueur des réponses dans le cadre du RLVR

Optimisation de politique de séquence sans biais de longueur : Révélation et contrôle de la variation de longueur des réponses dans le cadre du RLVR

Apprentissage Par Renforcement

Fanfan Liu, Youyang Yin, Peng Shi, et al.

Spider-Sense : Détection intrinsèque des risques pour une défense d'Agent efficace basée sur un tri hiérarchique adaptatif

Spider-Sense : Détection intrinsèque des risques pour une défense d'Agent efficace basée sur un tri hiérarchique adaptatif

Zhenxiong Yu, Zhi Yang, Zhiheng Jin, et al.

CAR-bench : Évaluation de la cohérence et de la prise en compte des limites des agents LLM face à l'incertitude du monde réel

CAR-bench : Évaluation de la cohérence et de la prise en compte des limites des agents LLM face à l'incertitude du monde réel

Johannes Kirmayr, Lukas Stappen, Elisabeth André

WeDLM : Réconcilier les modèles de langage par diffusion avec l'attention causale standard pour une inférence rapide

WeDLM : Réconcilier les modèles de langage par diffusion avec l'attention causale standard pour une inférence rapide

Modèle De Diffusion

Aiwei Liu, Minghua He, Shaoxun Zeng, et al.

Rapport technique Fun-ASR

Rapport technique Fun-ASR

Reconnaissance Vocale

Keyu An, Yanni Chen, Zhigao Chen, et al.

Accélération de la recherche scientifique avec Gemini : études de cas et techniques courantes

Accélération de la recherche scientifique avec Gemini : études de cas et techniques courantes

IA Pour La Science

David P. Woodruff, Vincent Cohen-Addad, Lalit Jain, et al.

Faire croître de petits agents par le biais d'enchères stratégiques

Faire croître de petits agents par le biais d'enchères stratégiques

Lisa Alazraki, William F. Shen, Yoram Bachrach, et al.

Vibe AIGC : Un nouveau paradigme pour la génération de contenu par orchestration agente

Vibe AIGC : Un nouveau paradigme pour la génération de contenu par orchestration agente

Jiaheng Liu, Yuanxing Zhang, Shihao Li, et al.

PaperSearchQA : Apprendre à rechercher et à raisonner sur les articles scientifiques avec RLVR

PaperSearchQA : Apprendre à rechercher et à raisonner sur les articles scientifiques avec RLVR

Génération Augmentée Par La Recherche

IA Pour La Science

James Burgess, Jan N. Hansen, Duo Peng, et al.

EgoActor : Intégrer la planification de tâches dans des actions egocentriques conscientes de l'espace pour les robots humanoïdes via des modèles visuels-langagiers

EgoActor : Intégrer la planification de tâches dans des actions egocentriques conscientes de l'espace pour les robots humanoïdes via des modèles visuels-langagiers

Réponse À Des Questions Visuelles

Yu Bai, MingMing Yu, Chaojie Li, et al.

A-RAG : Extension de la génération augmentée par récupération agente grâce à des interfaces de récupération hiérarchiques

A-RAG : Extension de la génération augmentée par récupération agente grâce à des interfaces de récupération hiérarchiques

Génération Augmentée Par La Recherche

Mingxuan Du, Benfeng Xu, Chiwei Zhu, et al.

Quant VideoGen : Génération vidéo longue auto-régressive via une quantification de cache KV à 2 bits

Quant VideoGen : Génération vidéo longue auto-régressive via une quantification de cache KV à 2 bits

Génération De Vidéo

Modèle De Diffusion

Haocheng Xi, Shuo Yang, Yilong Zhao, et al.

LLaDA2.1 : Accélération de la diffusion de texte par édition de tokens

LLaDA2.1 : Accélération de la diffusion de texte par édition de tokens

Modèle De Diffusion

Tiwei Bie, Maosong Cao, Xiang Cao, et al.

Atténuation des récompenses rares par modélisation des effets d’échantillonnage étape-par-étape et à long terme dans le GRPO fondé sur les flux

Atténuation des récompenses rares par modélisation des effets d’échantillonnage étape-par-étape et à long terme dans le GRPO fondé sur les flux

Modèle De Diffusion

Génération D'images

Yunze Tong, Mushui Liu, Canyu Zhao, et al.

Recurrent-Depth VLA : Échelle implicite du calcul en temps de test des modèles vision-langage-action par raisonnement itératif latent

Recurrent-Depth VLA : Échelle implicite du calcul en temps de test des modèles vision-langage-action par raisonnement itératif latent

Yalcin Tur, Jalal Naghiyev, Haoquan Fang, et al.

QuantaAlpha : Un cadre évolutif pour l’extraction d’alpha pilotée par LLM

QuantaAlpha : Un cadre évolutif pour l’extraction d’alpha pilotée par LLM

Jun Han, Shuo Zhang, Wei Li, et al.

Paradigme d'entraînement par alignement de sous-espaces piloté par l'écart de modalité pour les modèles linguistiques à grande échelle multimodaux

Paradigme d'entraînement par alignement de sous-espaces piloté par l'écart de modalité pour les modèles linguistiques à grande échelle multimodaux

Représentation Multimodale

Xiaomin Yu, Yi Xin, Wenjie Zhang, et al.

MOVA : Vers une génération vidéo-audio évolutif et synchronisé

MOVA : Vers une génération vidéo-audio évolutif et synchronisé

Génération De Vidéo

SII-OpenMOSS Team, Donghua Yu, Mingshu Chen, et al.

MemoryLLM : Mémoire à alimentation directe interprétable plug-and-play pour les transformateurs

MemoryLLM : Mémoire à alimentation directe interprétable plug-and-play pour les transformateurs

Ajay Jaiswal, Lauren Hannah, Han-Byul Kim, et al.

DreamDojo : un modèle mondial robotique généraliste issu de vidéos humaines à grande échelle

DreamDojo : un modèle mondial robotique généraliste issu de vidéos humaines à grande échelle

Compréhension Vidéo

Shenyuan Gao, William Liang, Kaiyuan Zheng, et al.

F-GRPO : Ne laissez pas votre politique apprendre ce qui est évident et oublier le rare

F-GRPO : Ne laissez pas votre politique apprendre ce qui est évident et oublier le rare

Apprentissage Par Renforcement

Daniil Plyusov, Alexey Gorbatovski, Boris Shaposhnikov, et al.

MSign : Un optimiseur prévenant l’instabilité d’entraînement dans les grands modèles linguistiques grâce à la restauration du rang stable

MSign : Un optimiseur prévenant l’instabilité d’entraînement dans les grands modèles linguistiques grâce à la restauration du rang stable

Entraînement Du Modèle

Lianhai Ren, Yucheng Ding, Xiao Liu, et al.

AudioSAE : Vers une compréhension des modèles de traitement audio à l’aide d’auto-encodeurs creux

AudioSAE : Vers une compréhension des modèles de traitement audio à l’aide d’auto-encodeurs creux

Traitement Audio Et Vocal

Apprentissage Profond

Georgii Aparin, Tasnima Sadekova, Alexey Rukhovich, et al.

Sur la dynamique de l'entropie dans le fine-tuning par renforcement des grands modèles linguistiques

Sur la dynamique de l'entropie dans le fine-tuning par renforcement des grands modèles linguistiques

Apprentissage Par Renforcement

Shumin Wang, Yuexiang Xie, Wenhao Zhang, et al.

OdysseyArena : Évaluation des grands modèles linguistiques pour des interactions longue portée, actives et inductives

OdysseyArena : Évaluation des grands modèles linguistiques pour des interactions longue portée, actives et inductives

Fangzhi Xu, Hang Yan, Qiushi Sun, et al.

Baichuan-M3 : Modélisation de l'interrogatoire clinique pour une prise de décision médicale fiable

Baichuan-M3 : Modélisation de l'interrogatoire clinique pour une prise de décision médicale fiable

Baichuan-M3 Team, Chengfeng Dou, Fan Yang, et al.

Modélisation générative par dérive

Modélisation générative par dérive

Modèle De Diffusion

Génération D'images

Mingyang Deng, He Li, Tianhong Li, Kaiming He

AlphaEdit : Édition de connaissances contrainte par espace nul pour les modèles de langage

AlphaEdit : Édition de connaissances contrainte par espace nul pour les modèles de langage

Génération De Texte

Junfeng Fang, Houcheng Jiang, Kun Wang, et al.

Apprendre à raisonner en 13 paramètres

Apprendre à raisonner en 13 paramètres

Réponse Aux Questions Intelligente

John X. Morris, Niloofar Mireshghallah, Mark Ibrahim, et al.

DFlash : Diffusion par blocs pour le décodage spéculatif Flash

DFlash : Diffusion par blocs pour le décodage spéculatif Flash

Modèle De Diffusion

Jian Chen, Yesheng Liang, Zhijian Liu

Forçage de contexte : génération vidéo autoregressive cohérente avec un long contexte

Forçage de contexte : génération vidéo autoregressive cohérente avec un long contexte

Génération De Vidéo

Modèle De Diffusion

Shuo Chen, Cong Wei, Sun Sun, et al.

MemSkill : Apprentissage et évolution de compétences mémoire pour des agents auto-évoluant

MemSkill : Apprentissage et évolution de compétences mémoire pour des agents auto-évoluant

Haozhen Zhang, Quanyu Long, Jianzhu Bao, et al.

Optimisation de politique de séquence sans biais de longueur : Révélation et contrôle de la variation de longueur des réponses dans le cadre du RLVR

Optimisation de politique de séquence sans biais de longueur : Révélation et contrôle de la variation de longueur des réponses dans le cadre du RLVR

Apprentissage Par Renforcement

Fanfan Liu, Youyang Yin, Peng Shi, et al.

Spider-Sense : Détection intrinsèque des risques pour une défense d'Agent efficace basée sur un tri hiérarchique adaptatif

Spider-Sense : Détection intrinsèque des risques pour une défense d'Agent efficace basée sur un tri hiérarchique adaptatif

Zhenxiong Yu, Zhi Yang, Zhiheng Jin, et al.

CAR-bench : Évaluation de la cohérence et de la prise en compte des limites des agents LLM face à l'incertitude du monde réel

CAR-bench : Évaluation de la cohérence et de la prise en compte des limites des agents LLM face à l'incertitude du monde réel

Johannes Kirmayr, Lukas Stappen, Elisabeth André

WeDLM : Réconcilier les modèles de langage par diffusion avec l'attention causale standard pour une inférence rapide

WeDLM : Réconcilier les modèles de langage par diffusion avec l'attention causale standard pour une inférence rapide

Modèle De Diffusion

Aiwei Liu, Minghua He, Shaoxun Zeng, et al.

Rapport technique Fun-ASR

Rapport technique Fun-ASR

Reconnaissance Vocale

Keyu An, Yanni Chen, Zhigao Chen, et al.

Accélération de la recherche scientifique avec Gemini : études de cas et techniques courantes

Accélération de la recherche scientifique avec Gemini : études de cas et techniques courantes

IA Pour La Science

David P. Woodruff, Vincent Cohen-Addad, Lalit Jain, et al.

Faire croître de petits agents par le biais d'enchères stratégiques

Faire croître de petits agents par le biais d'enchères stratégiques

Lisa Alazraki, William F. Shen, Yoram Bachrach, et al.

Vibe AIGC : Un nouveau paradigme pour la génération de contenu par orchestration agente

Vibe AIGC : Un nouveau paradigme pour la génération de contenu par orchestration agente

Jiaheng Liu, Yuanxing Zhang, Shihao Li, et al.

PaperSearchQA : Apprendre à rechercher et à raisonner sur les articles scientifiques avec RLVR

PaperSearchQA : Apprendre à rechercher et à raisonner sur les articles scientifiques avec RLVR

Génération Augmentée Par La Recherche

IA Pour La Science

James Burgess, Jan N. Hansen, Duo Peng, et al.

EgoActor : Intégrer la planification de tâches dans des actions egocentriques conscientes de l'espace pour les robots humanoïdes via des modèles visuels-langagiers

EgoActor : Intégrer la planification de tâches dans des actions egocentriques conscientes de l'espace pour les robots humanoïdes via des modèles visuels-langagiers

Réponse À Des Questions Visuelles

Yu Bai, MingMing Yu, Chaojie Li, et al.

A-RAG : Extension de la génération augmentée par récupération agente grâce à des interfaces de récupération hiérarchiques

A-RAG : Extension de la génération augmentée par récupération agente grâce à des interfaces de récupération hiérarchiques

Génération Augmentée Par La Recherche

Mingxuan Du, Benfeng Xu, Chiwei Zhu, et al.

Quant VideoGen : Génération vidéo longue auto-régressive via une quantification de cache KV à 2 bits

Quant VideoGen : Génération vidéo longue auto-régressive via une quantification de cache KV à 2 bits

Génération De Vidéo

Modèle De Diffusion

Haocheng Xi, Shuo Yang, Yilong Zhao, et al.