HyperAI

Principal

GPU

Console
Studio
Docs
Tarifs

Pulse

Actualités

Ressources

Publications de recherche
Notebooks
Jeux de données
Wiki

Benchmarks

SOTA
Modèles LLM
Classement des GPU

Communauté

Événements

Utilitaires

À propos Conditions d’utilisation Politique de confidentialité
Français

Command Palette

Search for a command to run...

HyperAI
Papers

Papers

Articles de recherche en IA de pointe mis à jour quotidiennement pour vous aider à suivre les dernières tendances en IA

Construire l’avenir de l’intelligence artificielle

À propos

À propos Support Aide relative au jeu de données

Produits

Actualités Publications de recherche Notebooks Jeux de données Wiki

Liens

© HyperAI

GitHub Discord X (formerly Twitter)

HyperAI

Principal

GPU

Console
Studio
Docs
Tarifs

Pulse

Actualités

Ressources

Publications de recherche
Notebooks
Jeux de données
Wiki

Benchmarks

SOTA
Modèles LLM
Classement des GPU

Communauté

Événements

Utilitaires

À propos Conditions d’utilisation Politique de confidentialité
Français

Command Palette

Search for a command to run...

HyperAI
Papers

Papers

Articles de recherche en IA de pointe mis à jour quotidiennement pour vous aider à suivre les dernières tendances en IA

Construire l’avenir de l’intelligence artificielle

À propos

À propos Support Aide relative au jeu de données

Produits

Actualités Publications de recherche Notebooks Jeux de données Wiki

Liens

© HyperAI

GitHub Discord X (formerly Twitter)

MISE EN CACHE DE LA MÉMOIRE : LES RNN À MÉMOIRE CROISSANTE

MISE EN CACHE DE LA MÉMOIRE : LES RNN À MÉMOIRE CROISSANTE

Apprentissage Profond

Ali Behrouz, Zeman Li, Yuan Deng, et al.

RobotValues : Évaluation des robots domestiques lorsque les valeurs humaines entrent en conflit

RobotValues : Évaluation des robots domestiques lorsque les valeurs humaines entrent en conflit

Jongwook Han, Hyeongjin Kim, Yohan Jo

VideoKR : Vers une compréhension vidéo intensive en connaissances et en raisonnement

Compréhension Vidéo

Réponse À Des Questions Visuelles

Lin Fu, Zheyuan Yang, Yang Wang, et al.

AdaPlanBench : Évaluation de la planification adaptative dans les agents de grands modèles de langage sous des contraintes du monde et de l'utilisateur

Jiayu Liu, Cheng Qian, Zhenhailong Wang, et al.

TIDE : Découverte proactive de multiples problèmes via une itération guidée par des modèles

Soyeong Jeong, Jinheon Baek, Minki Kang, et al.

ArcANE : Les Agents de langage en jeu de rôle restent-ils dans le personnage au bon moment ?

Woojung Song, Nalim Kim, Sangjun Song, et al.

Code2LoRA : Adaptateurs générés par hypernetwork pour les modèles de langage de code dans le contexte de l'évolution logicielle

Génération De Code

Liliana Hotsko, Yinxi Li, Yuntian Deng, et al.

Gradient de politique auto-distillée

Apprentissage Par Renforcement

Yifeng Liu, Shiyouan Zhang, Yifan Zhang, et al.

GSM-Symbolic : Comprendre les limites du raisonnement mathématique dans les grands modèles de langage

Iman Mirzadeh, Keivan Alizadeh, Oncel Tuzel, et al.

MUSE-Autoskill : Agents à évolution autonome par création de compétences, mémoire, gestion et évaluation

Huawei Lin, Peng Li, Jie Song, et al.

Nemotron 3 Ultra : un modèle hybride Mamba-Transformer à Experts Mélangeés (MoE) ouvert et efficace pour le raisonnement agentique

Akter et al., Xiao et al., Liu et al., et al.

Qwen-Image-Flash : Au-delà de la conception objective

Texte Vers Image

Génération D'images

Tianhe Wu, Kun Yan, Zikai Zhou, et al.

OVO-S-Bench : Un benchmark hiérarchique pour l'intelligence spatiale en streaming dans les LLM multimodaux

Compréhension Vidéo

Yifei Li, Pengyiang Liu, Yuhang Zang, et al.

Reproduire, analyser et détecter le piratage de la récompense dans l'apprentissage par renforcement basé sur des rubriques

Apprentissage Par Renforcement

Xuekang Wang, Zhuoyuan Hao, Shuo Hou, et al.

Où les Agents de recherche approfondie font-ils des erreurs ? Localisation des erreurs au niveau des spans dans les trajectoires des Agents

Jiaming Wang, Ziteng Feng, Jiangtao Wu, et al.

Modèle d'interaction audio

Traitement Audio Et Vocal

Zhifei Xie, Zihang Liu, Ze An, et al.

Cosmos 3 : Modèles du monde omnimodaux pour l'IA physique

Aditi, Niket Agarwal, Arslan Ali, et al.

Apprentissage rapide et lent : vers des LLMs capables d'adaptation continue

Affinage Supervisé

Entraînement Du Modèle

Rishabh Tiwari, Kusha Sareen, Lakshya A Agrawal, et al.

LEAP : Renforcer les LLM pour les mathématiques formelles à l'aide de frameworks agents

Génération De Texte

Po-Nien Kung, Linfeng Song, Dawsen Hwang, et al.

Les modèles du monde rencontrent les modèles de langage : sur la complémentarité du raisonnement concret et abstrait

Réponse À Des Questions Visuelles

Yucheng Zhou, Wei Tao, Yiwen Guo, et al.

De l'activation à la causalité : Découverte de représentations visuelles causales dans le cerveau humain

Génération D'images

Représentation Multimodale

Yuval Golbari, Navve Wasserman, Matias Cosarinsky, et al.

Une théorie des perturbations locales pour l'interférence et la récupération inter-domaines dans le RL multi-domaines

Apprentissage Par Renforcement

Lei Yang, Siyu Ding, Deyi Xiong

Humanoid-GPT : Mise à l'échelle des données et de la structure pour le suivi de mouvement zéro-shot

Zekun Qi, Xuchuan Chen, Dairu Liu, et al.

Distillation par région de confiance sur politique

Génération De Texte

Xingrun Xing, Haoqing Wang, Boyan Gao, et al.

OCC-RAG : Noyau Cognitif Optimal pour la Réponse Fidèle aux Questions

Génération Augmentée Par La Recherche

Réponse Aux Questions Intelligente

Maksim Savkin, Mikhail Goncharov, Alexander Gambashidze, et al.

MAI-Thinking-1 : Concevoir une machine de type Hill-Climbing

Entraînement Du Modèle

$VLM^3$ : Les modèles de langage visuels sont des apprenants natifs en 3D

Génération 3D

Estimation De Profondeur

Zhipeng Cai, Zhuang Liu, Yunyang Xiong, et al.

Harness-1 : Apprentissage par renforcement pour les agents de recherche avec des harnais externalisant l’état

Génération Augmentée Par La Recherche

Pengcheng Jiang, Zhiyi Shi, Kelly Hong, et al.

DeepCrack : Une architecture d’apprentissage hiérarchique de caractéristiques profondes pour la segmentation des fissures

Segmentation Sémantique

Segmentation D'images

Yahui Liu, Lian Yao, Xiaohu Lu, et al.

VideoMLA : Cache KV latent de bas rang pour la diffusion vidéo autoregressive à l'échelle de la minute

Génération De Vidéo

Modèle De Diffusion

Hidir Yesiltepe, Jiazhen Hu, Tuna Han Salih Meral, et al.

Draft-OPD : Distillation sur politique pour modèles de brouillon spéculatifs

Génération De Texte

Haodi Lei, Yafy Li, Haoran Zhang, et al.

K-BrowseComp : Un benchmark d'Agent de navigation web ancré dans des contextes coréens

Nahyun Lee, Dongkeun Yoon, Guijin Son, et al.

MISE EN CACHE DE LA MÉMOIRE : LES RNN À MÉMOIRE CROISSANTE

MISE EN CACHE DE LA MÉMOIRE : LES RNN À MÉMOIRE CROISSANTE

Apprentissage Profond

Ali Behrouz, Zeman Li, Yuan Deng, et al.

RobotValues : Évaluation des robots domestiques lorsque les valeurs humaines entrent en conflit

RobotValues : Évaluation des robots domestiques lorsque les valeurs humaines entrent en conflit

Jongwook Han, Hyeongjin Kim, Yohan Jo

VideoKR : Vers une compréhension vidéo intensive en connaissances et en raisonnement

Compréhension Vidéo

Réponse À Des Questions Visuelles

Lin Fu, Zheyuan Yang, Yang Wang, et al.

AdaPlanBench : Évaluation de la planification adaptative dans les agents de grands modèles de langage sous des contraintes du monde et de l'utilisateur

Jiayu Liu, Cheng Qian, Zhenhailong Wang, et al.

TIDE : Découverte proactive de multiples problèmes via une itération guidée par des modèles

Soyeong Jeong, Jinheon Baek, Minki Kang, et al.

ArcANE : Les Agents de langage en jeu de rôle restent-ils dans le personnage au bon moment ?

Woojung Song, Nalim Kim, Sangjun Song, et al.

Code2LoRA : Adaptateurs générés par hypernetwork pour les modèles de langage de code dans le contexte de l'évolution logicielle

Génération De Code

Liliana Hotsko, Yinxi Li, Yuntian Deng, et al.

Gradient de politique auto-distillée

Apprentissage Par Renforcement

Yifeng Liu, Shiyouan Zhang, Yifan Zhang, et al.

GSM-Symbolic : Comprendre les limites du raisonnement mathématique dans les grands modèles de langage

Iman Mirzadeh, Keivan Alizadeh, Oncel Tuzel, et al.

MUSE-Autoskill : Agents à évolution autonome par création de compétences, mémoire, gestion et évaluation

Huawei Lin, Peng Li, Jie Song, et al.

Nemotron 3 Ultra : un modèle hybride Mamba-Transformer à Experts Mélangeés (MoE) ouvert et efficace pour le raisonnement agentique

Akter et al., Xiao et al., Liu et al., et al.

Qwen-Image-Flash : Au-delà de la conception objective

Texte Vers Image

Génération D'images

Tianhe Wu, Kun Yan, Zikai Zhou, et al.

OVO-S-Bench : Un benchmark hiérarchique pour l'intelligence spatiale en streaming dans les LLM multimodaux

Compréhension Vidéo

Yifei Li, Pengyiang Liu, Yuhang Zang, et al.

Reproduire, analyser et détecter le piratage de la récompense dans l'apprentissage par renforcement basé sur des rubriques

Apprentissage Par Renforcement

Xuekang Wang, Zhuoyuan Hao, Shuo Hou, et al.

Où les Agents de recherche approfondie font-ils des erreurs ? Localisation des erreurs au niveau des spans dans les trajectoires des Agents

Jiaming Wang, Ziteng Feng, Jiangtao Wu, et al.

Modèle d'interaction audio

Traitement Audio Et Vocal

Zhifei Xie, Zihang Liu, Ze An, et al.

Cosmos 3 : Modèles du monde omnimodaux pour l'IA physique

Aditi, Niket Agarwal, Arslan Ali, et al.

Apprentissage rapide et lent : vers des LLMs capables d'adaptation continue

Affinage Supervisé

Entraînement Du Modèle

Rishabh Tiwari, Kusha Sareen, Lakshya A Agrawal, et al.

LEAP : Renforcer les LLM pour les mathématiques formelles à l'aide de frameworks agents

Génération De Texte

Po-Nien Kung, Linfeng Song, Dawsen Hwang, et al.

Les modèles du monde rencontrent les modèles de langage : sur la complémentarité du raisonnement concret et abstrait

Réponse À Des Questions Visuelles

Yucheng Zhou, Wei Tao, Yiwen Guo, et al.

De l'activation à la causalité : Découverte de représentations visuelles causales dans le cerveau humain

Génération D'images

Représentation Multimodale

Yuval Golbari, Navve Wasserman, Matias Cosarinsky, et al.

Une théorie des perturbations locales pour l'interférence et la récupération inter-domaines dans le RL multi-domaines

Apprentissage Par Renforcement

Lei Yang, Siyu Ding, Deyi Xiong

Humanoid-GPT : Mise à l'échelle des données et de la structure pour le suivi de mouvement zéro-shot

Zekun Qi, Xuchuan Chen, Dairu Liu, et al.

Distillation par région de confiance sur politique

Génération De Texte

Xingrun Xing, Haoqing Wang, Boyan Gao, et al.

OCC-RAG : Noyau Cognitif Optimal pour la Réponse Fidèle aux Questions

Génération Augmentée Par La Recherche

Réponse Aux Questions Intelligente

Maksim Savkin, Mikhail Goncharov, Alexander Gambashidze, et al.

MAI-Thinking-1 : Concevoir une machine de type Hill-Climbing

Entraînement Du Modèle

$VLM^3$ : Les modèles de langage visuels sont des apprenants natifs en 3D

Génération 3D

Estimation De Profondeur

Zhipeng Cai, Zhuang Liu, Yunyang Xiong, et al.

Harness-1 : Apprentissage par renforcement pour les agents de recherche avec des harnais externalisant l’état

Génération Augmentée Par La Recherche

Pengcheng Jiang, Zhiyi Shi, Kelly Hong, et al.

DeepCrack : Une architecture d’apprentissage hiérarchique de caractéristiques profondes pour la segmentation des fissures

Segmentation Sémantique

Segmentation D'images

Yahui Liu, Lian Yao, Xiaohu Lu, et al.

VideoMLA : Cache KV latent de bas rang pour la diffusion vidéo autoregressive à l'échelle de la minute

Génération De Vidéo

Modèle De Diffusion

Hidir Yesiltepe, Jiazhen Hu, Tuna Han Salih Meral, et al.

Draft-OPD : Distillation sur politique pour modèles de brouillon spéculatifs

Génération De Texte

Haodi Lei, Yafy Li, Haoran Zhang, et al.

K-BrowseComp : Un benchmark d'Agent de navigation web ancré dans des contextes coréens

Nahyun Lee, Dongkeun Yoon, Guijin Son, et al.

VideoKR : Vers une compréhension vidéo intensive en connaissances et en raisonnement

AdaPlanBench : Évaluation de la planification adaptative dans les agents de grands modèles de langage sous des contraintes du monde et de l'utilisateur

TIDE : Découverte proactive de multiples problèmes via une itération guidée par des modèles

ArcANE : Les Agents de langage en jeu de rôle restent-ils dans le personnage au bon moment ?

Code2LoRA : Adaptateurs générés par hypernetwork pour les modèles de langage de code dans le contexte de l'évolution logicielle

Gradient de politique auto-distillée

GSM-Symbolic : Comprendre les limites du raisonnement mathématique dans les grands modèles de langage

MUSE-Autoskill : Agents à évolution autonome par création de compétences, mémoire, gestion et évaluation

Nemotron 3 Ultra : un modèle hybride Mamba-Transformer à Experts Mélangeés (MoE) ouvert et efficace pour le raisonnement agentique

Qwen-Image-Flash : Au-delà de la conception objective

OVO-S-Bench : Un benchmark hiérarchique pour l'intelligence spatiale en streaming dans les LLM multimodaux

Reproduire, analyser et détecter le piratage de la récompense dans l'apprentissage par renforcement basé sur des rubriques

Où les Agents de recherche approfondie font-ils des erreurs ? Localisation des erreurs au niveau des spans dans les trajectoires des Agents

Modèle d'interaction audio

Cosmos 3 : Modèles du monde omnimodaux pour l'IA physique

Apprentissage rapide et lent : vers des LLMs capables d'adaptation continue

LEAP : Renforcer les LLM pour les mathématiques formelles à l'aide de frameworks agents

Les modèles du monde rencontrent les modèles de langage : sur la complémentarité du raisonnement concret et abstrait

De l'activation à la causalité : Découverte de représentations visuelles causales dans le cerveau humain

Une théorie des perturbations locales pour l'interférence et la récupération inter-domaines dans le RL multi-domaines

Humanoid-GPT : Mise à l'échelle des données et de la structure pour le suivi de mouvement zéro-shot

Distillation par région de confiance sur politique

OCC-RAG : Noyau Cognitif Optimal pour la Réponse Fidèle aux Questions

MAI-Thinking-1 : Concevoir une machine de type Hill-Climbing

$VLM^3$ : Les modèles de langage visuels sont des apprenants natifs en 3D

Harness-1 : Apprentissage par renforcement pour les agents de recherche avec des harnais externalisant l’état

DeepCrack : Une architecture d’apprentissage hiérarchique de caractéristiques profondes pour la segmentation des fissures

VideoMLA : Cache KV latent de bas rang pour la diffusion vidéo autoregressive à l'échelle de la minute

Draft-OPD : Distillation sur politique pour modèles de brouillon spéculatifs

K-BrowseComp : Un benchmark d'Agent de navigation web ancré dans des contextes coréens

VideoKR : Vers une compréhension vidéo intensive en connaissances et en raisonnement

AdaPlanBench : Évaluation de la planification adaptative dans les agents de grands modèles de langage sous des contraintes du monde et de l'utilisateur

TIDE : Découverte proactive de multiples problèmes via une itération guidée par des modèles

ArcANE : Les Agents de langage en jeu de rôle restent-ils dans le personnage au bon moment ?

Code2LoRA : Adaptateurs générés par hypernetwork pour les modèles de langage de code dans le contexte de l'évolution logicielle

Gradient de politique auto-distillée

GSM-Symbolic : Comprendre les limites du raisonnement mathématique dans les grands modèles de langage

MUSE-Autoskill : Agents à évolution autonome par création de compétences, mémoire, gestion et évaluation

Nemotron 3 Ultra : un modèle hybride Mamba-Transformer à Experts Mélangeés (MoE) ouvert et efficace pour le raisonnement agentique

Qwen-Image-Flash : Au-delà de la conception objective

OVO-S-Bench : Un benchmark hiérarchique pour l'intelligence spatiale en streaming dans les LLM multimodaux

Reproduire, analyser et détecter le piratage de la récompense dans l'apprentissage par renforcement basé sur des rubriques

Où les Agents de recherche approfondie font-ils des erreurs ? Localisation des erreurs au niveau des spans dans les trajectoires des Agents

Modèle d'interaction audio

Cosmos 3 : Modèles du monde omnimodaux pour l'IA physique

Apprentissage rapide et lent : vers des LLMs capables d'adaptation continue

LEAP : Renforcer les LLM pour les mathématiques formelles à l'aide de frameworks agents

Les modèles du monde rencontrent les modèles de langage : sur la complémentarité du raisonnement concret et abstrait

De l'activation à la causalité : Découverte de représentations visuelles causales dans le cerveau humain

Une théorie des perturbations locales pour l'interférence et la récupération inter-domaines dans le RL multi-domaines

Humanoid-GPT : Mise à l'échelle des données et de la structure pour le suivi de mouvement zéro-shot

Distillation par région de confiance sur politique

OCC-RAG : Noyau Cognitif Optimal pour la Réponse Fidèle aux Questions

MAI-Thinking-1 : Concevoir une machine de type Hill-Climbing

$VLM^3$ : Les modèles de langage visuels sont des apprenants natifs en 3D

Harness-1 : Apprentissage par renforcement pour les agents de recherche avec des harnais externalisant l’état

DeepCrack : Une architecture d’apprentissage hiérarchique de caractéristiques profondes pour la segmentation des fissures

VideoMLA : Cache KV latent de bas rang pour la diffusion vidéo autoregressive à l'échelle de la minute

Draft-OPD : Distillation sur politique pour modèles de brouillon spéculatifs

K-BrowseComp : Un benchmark d'Agent de navigation web ancré dans des contextes coréens