HyperAI

Principal

GPU

Console
Docs
Tarifs

Pulse

Actualités

Ressources

Publications de recherche
Notebooks
Jeux de données
Wiki

Benchmarks

SOTA
Modèles LLM
Classement des GPU

Communauté

Événements

Utilitaires

À propos Conditions d’utilisation Politique de confidentialité
Français

Command Palette

Search for a command to run...

HyperAI
Papers

Papers

Articles de recherche en IA de pointe mis à jour quotidiennement pour vous aider à suivre les dernières tendances en IA

Construire l’avenir de l’intelligence artificielle

À propos

À propos Aide relative au jeu de données

Produits

Actualités Notebooks Jeux de données Wiki

Liens

© HyperAI

GitHub Discord X (formerly Twitter)

HyperAI

Principal

GPU

Console
Docs
Tarifs

Pulse

Actualités

Ressources

Publications de recherche
Notebooks
Jeux de données
Wiki

Benchmarks

SOTA
Modèles LLM
Classement des GPU

Communauté

Événements

Utilitaires

À propos Conditions d’utilisation Politique de confidentialité
Français

Command Palette

Search for a command to run...

HyperAI
Papers

Papers

Articles de recherche en IA de pointe mis à jour quotidiennement pour vous aider à suivre les dernières tendances en IA

Construire l’avenir de l’intelligence artificielle

À propos

À propos Aide relative au jeu de données

Produits

Actualités Notebooks Jeux de données Wiki

Liens

© HyperAI

GitHub Discord X (formerly Twitter)

GUI-Libra : Entraînement d'agents GUI natifs à raisonner et agir grâce à une supervision consciente des actions et à un apprentissage par renforcement partiellement vérifiable

GUI-Libra : Entraînement d'agents GUI natifs à raisonner et agir grâce à une supervision consciente des actions et à un apprentissage par renforcement partiellement vérifiable

Affinage Supervisé

Rui Yang, Qianhui Wu, Zhaoyang Wang, et al.

SkyReels-V4 : modèle de génération, de comblement et d'édition vidéo-audio multimodale

SkyReels-V4 : modèle de génération, de comblement et d'édition vidéo-audio multimodale

Texte Vers Vidéo

Modèle De Diffusion

Guibin Chen, Dixuan Lin, Jiangping Yang, et al.

ARLArena : Un cadre unifié pour l'apprentissage par renforcement agencé stable

ARLArena : Un cadre unifié pour l'apprentissage par renforcement agencé stable

Apprentissage Par Renforcement

Xiaoxuan Wang, Han Zhang, Haixin Wang, et al.

DreamID-Omni : Cadre unifié pour la génération audiovisuelle contrôlable centrée sur l’humain

DreamID-Omni : Cadre unifié pour la génération audiovisuelle contrôlable centrée sur l’humain

Xu Guo, Fulong Ye, Qichao Sun, et al.

MolHIT : Progresser dans la génération de graphes moléculaires grâce à des modèles de diffusion discrète hiérarchiques

MolHIT : Progresser dans la génération de graphes moléculaires grâce à des modèles de diffusion discrète hiérarchiques

Modèle De Diffusion

IA Pour La Science

Hojung Jung, Rodrigo Hormazabal, Jaehyeong Jo, et al.

HyTRec : Une architecture hybride à attention sensible au temps pour la recommandation séquentielle de longues séquences de comportements

HyTRec : Une architecture hybride à attention sensible au temps pour la recommandation séquentielle de longues séquences de comportements

Modélisation Des Préférences

Lei Xin, Yuhao Zheng, Ke Cheng, et al.

DREAM : Évaluation de la recherche approfondie avec des métriques agences

DREAM : Évaluation de la recherche approfondie avec des métriques agences

Elad Ben Avraham, Changhao Li, Ron Dorfman, et al.

LongCLI-Bench : Un benchmark préliminaire et une étude sur la programmation agente à horizon long dans les interfaces en ligne de commande

LongCLI-Bench : Un benchmark préliminaire et une étude sur la programmation agente à horizon long dans les interfaces en ligne de commande

Yukang Feng, Jianwen Sun, Zelai Yang, et al.

PyVision-RL : Développement de modèles visionnels agents ouverts par apprentissage par renforcement

PyVision-RL : Développement de modèles visionnels agents ouverts par apprentissage par renforcement

Compréhension Vidéo

Shitian Zhao, Shaoheng Lin, Ming Li, et al.

De la perception à l’action : une benchmark interactive pour le raisonnement visuel

De la perception à l’action : une benchmark interactive pour le raisonnement visuel

Représentation Multimodale

Yuhao Wu, Maojia Song, Yihuai Lan, et al.

Reranker centré sur la requête et conscient de la mémoire pour le traitement de contextes longs

Reranker centré sur la requête et conscient de la mémoire pour le traitement de contextes longs

Génération Augmentée Par La Recherche

Yuqing Li, Jiangnan Li, Mo Yu, et al.

Sur l'ingénierie des données pour l'extension des capacités terminales des LLM

Sur l'ingénierie des données pour l'extension des capacités terminales des LLM

Entraînement Du Modèle

Renjie Pi, Grace Lam, Mohammad Shoeybi, et al.

DSDR : Régularisation par diversité à double échelle pour l’exploration dans le raisonnement des LLM

DSDR : Régularisation par diversité à double échelle pour l’exploration dans le raisonnement des LLM

Apprentissage Par Renforcement

Zhongwei Wan, Yun Shen, Zhihao Dou, et al.

Mobile-O : Compréhension et génération multimodale unifiées sur appareil mobile

Mobile-O : Compréhension et génération multimodale unifiées sur appareil mobile

Modèle De Diffusion

Abdelrahman Shaker, Ahmed Heakl, Jaseel Muhammad, et al.

TOPReward : Probabilités de tokens comme récompenses cachées zéro-shot pour la robotique

TOPReward : Probabilités de tokens comme récompenses cachées zéro-shot pour la robotique

Apprentissage Par Renforcement

Représentation Multimodale

Shirui Chen, Cole Harrison, Ying-Chun Lee, et al.

ManCAR : Raisonnement latent contraint par variété avec calcul adaptatif en temps de test pour la recommandation séquentielle

ManCAR : Raisonnement latent contraint par variété avec calcul adaptatif en temps de test pour la recommandation séquentielle

Modélisation Des Préférences

Apprentissage Multi-tâches

Kun Yang, Yuxuan Zhu, Yazhe Chen, et al.

VLANeXt : Des Recettes pour Construire des Modèles VLA Robustes

VLANeXt : Des Recettes pour Construire des Modèles VLA Robustes

Représentation Multimodale

Xiao-Ming Wu, Bin Fan, Kang Liao, et al.

Un très grand ensemble de raisonnement vidéo

Un très grand ensemble de raisonnement vidéo

Compréhension Vidéo

Maijunxian Wang, Ruisi Wang, Juyi Lin, et al.

Entraînement sélectif des grands modèles vision-langage par gain d'information visuelle

Entraînement sélectif des grands modèles vision-langage par gain d'information visuelle

Affinage Supervisé

Seulbi Lee, Sangheum Hwang

DeepVision-103K : Un jeu de données mathématique à large couverture, diversifié visuellement et vérifiable pour le raisonnement multimodal

DeepVision-103K : Un jeu de données mathématique à large couverture, diversifié visuellement et vérifiable pour le raisonnement multimodal

Réponse À Des Questions Visuelles

Haoxiang Sun, Lizhen Xu, Bing Zhao, et al.

SARAH : Humains agents en temps réel sensibles à l'espace

SARAH : Humains agents en temps réel sensibles à l'espace

Représentation Multimodale

Génération 3D

Evonne Ng, Siwei Zhang, Zhang Chen, et al.

EgoPush : Apprentissage d'une réarrangement multi-objets egocentrique bout-en-bout pour les robots mobiles

EgoPush : Apprentissage d'une réarrangement multi-objets egocentrique bout-en-bout pour les robots mobiles

Boyuan An, Zhexiong Wang, Yipeng Wang, et al.

Realité générée : simulation du monde centrée sur l’humain à l’aide de la génération vidéo interactive avec contrôle de la main et de la caméra

Realité générée : simulation du monde centrée sur l’humain à l’aide de la génération vidéo interactive avec contrôle de la main et de la caméra

Modèle De Diffusion

Génération De Vidéo

Linxi Xie, Lisong C. Sun, Ashley Neall, et al.

VESPO : Optimisation Variationnelle de Politique Douce au Niveau de la Séquence pour une Formation Stable des LLM en Mode Hors-Échantillonnage

VESPO : Optimisation Variationnelle de Politique Douce au Niveau de la Séquence pour une Formation Stable des LLM en Mode Hors-Échantillonnage

Apprentissage Par Renforcement

Guobin Shen, Chenxiao Zhao, Xiang Cheng, et al.

Rapport technique Arcee Trinity

Rapport technique Arcee Trinity

Varun Singh, Lucas Krauss, Sami Jaghouar, et al.

Cadre pratique de gestion des risques de l’IA de pointe : Rapport technique d’analyse des risques v1.5

Cadre pratique de gestion des risques de l’IA de pointe : Rapport technique d’analyse des risques v1.5

Dongrui Liu, Yi Yu, Jie Zhang, et al.

Latents unifiés (UL) : Comment entraîner vos latents

Latents unifiés (UL) : Comment entraîner vos latents

Modèle De Diffusion

Génération D'images

Jonathan Heek, Emiel Hoogeboom, Thomas Mensink, et al.

Mobile-Agent-v3.5 : Agents fondamentaux GUI multiplateformes

Mobile-Agent-v3.5 : Agents fondamentaux GUI multiplateformes

Haiyang Xu, Xi Zhang, Haowei Liu, et al.

SpargeAttention2 : Une attention creuse entraînable grâce au masquage hybride Top-k+Top-p et au fine-tuning par distillation

SpargeAttention2 : Une attention creuse entraînable grâce au masquage hybride Top-k+Top-p et au fine-tuning par distillation

Modèle De Diffusion

Jintao Zhang, Kai Jiang, Chendong Xiang, et al.

AutoWebWorld : Synthétisation d’environnements web vérifiables infinis via des machines à états finies

AutoWebWorld : Synthétisation d’environnements web vérifiables infinis via des machines à états finies

Génération 3D

Yifan Wu, Yiran Peng, Yiyu Chen, et al.

Vérification de Modèles Bornée pour des Systèmes Client-Serveur Non Bornés

Vérification de Modèles Bornée pour des Systèmes Client-Serveur Non Bornés

Apprentissage Profond

Ramchandra Phawade, Tephilla Prince, S. Sheerazuddin

Combien de raisonnement les modèles améliorés par récupération ajoutent-ils au-delà des LLM ? Un cadre d'évaluation pour l'inférence multi-sauts sur un savoir hybride

Combien de raisonnement les modèles améliorés par récupération ajoutent-ils au-delà des LLM ? Un cadre d'évaluation pour l'inférence multi-sauts sur un savoir hybride

Génération Augmentée Par La Recherche

Junhong Lin, Bing Zhang, Song Wang, et al.

GUI-Libra : Entraînement d'agents GUI natifs à raisonner et agir grâce à une supervision consciente des actions et à un apprentissage par renforcement partiellement vérifiable

GUI-Libra : Entraînement d'agents GUI natifs à raisonner et agir grâce à une supervision consciente des actions et à un apprentissage par renforcement partiellement vérifiable

Affinage Supervisé

Rui Yang, Qianhui Wu, Zhaoyang Wang, et al.

SkyReels-V4 : modèle de génération, de comblement et d'édition vidéo-audio multimodale

SkyReels-V4 : modèle de génération, de comblement et d'édition vidéo-audio multimodale

Texte Vers Vidéo

Modèle De Diffusion

Guibin Chen, Dixuan Lin, Jiangping Yang, et al.

ARLArena : Un cadre unifié pour l'apprentissage par renforcement agencé stable

ARLArena : Un cadre unifié pour l'apprentissage par renforcement agencé stable

Apprentissage Par Renforcement

Xiaoxuan Wang, Han Zhang, Haixin Wang, et al.

DreamID-Omni : Cadre unifié pour la génération audiovisuelle contrôlable centrée sur l’humain

DreamID-Omni : Cadre unifié pour la génération audiovisuelle contrôlable centrée sur l’humain

Xu Guo, Fulong Ye, Qichao Sun, et al.

MolHIT : Progresser dans la génération de graphes moléculaires grâce à des modèles de diffusion discrète hiérarchiques

MolHIT : Progresser dans la génération de graphes moléculaires grâce à des modèles de diffusion discrète hiérarchiques

Modèle De Diffusion

IA Pour La Science

Hojung Jung, Rodrigo Hormazabal, Jaehyeong Jo, et al.

HyTRec : Une architecture hybride à attention sensible au temps pour la recommandation séquentielle de longues séquences de comportements

HyTRec : Une architecture hybride à attention sensible au temps pour la recommandation séquentielle de longues séquences de comportements

Modélisation Des Préférences

Lei Xin, Yuhao Zheng, Ke Cheng, et al.

DREAM : Évaluation de la recherche approfondie avec des métriques agences

DREAM : Évaluation de la recherche approfondie avec des métriques agences

Elad Ben Avraham, Changhao Li, Ron Dorfman, et al.

LongCLI-Bench : Un benchmark préliminaire et une étude sur la programmation agente à horizon long dans les interfaces en ligne de commande

LongCLI-Bench : Un benchmark préliminaire et une étude sur la programmation agente à horizon long dans les interfaces en ligne de commande

Yukang Feng, Jianwen Sun, Zelai Yang, et al.

PyVision-RL : Développement de modèles visionnels agents ouverts par apprentissage par renforcement

PyVision-RL : Développement de modèles visionnels agents ouverts par apprentissage par renforcement

Compréhension Vidéo

Shitian Zhao, Shaoheng Lin, Ming Li, et al.

De la perception à l’action : une benchmark interactive pour le raisonnement visuel

De la perception à l’action : une benchmark interactive pour le raisonnement visuel

Représentation Multimodale

Yuhao Wu, Maojia Song, Yihuai Lan, et al.

Reranker centré sur la requête et conscient de la mémoire pour le traitement de contextes longs

Reranker centré sur la requête et conscient de la mémoire pour le traitement de contextes longs

Génération Augmentée Par La Recherche

Yuqing Li, Jiangnan Li, Mo Yu, et al.

Sur l'ingénierie des données pour l'extension des capacités terminales des LLM

Sur l'ingénierie des données pour l'extension des capacités terminales des LLM

Entraînement Du Modèle

Renjie Pi, Grace Lam, Mohammad Shoeybi, et al.

DSDR : Régularisation par diversité à double échelle pour l’exploration dans le raisonnement des LLM

DSDR : Régularisation par diversité à double échelle pour l’exploration dans le raisonnement des LLM

Apprentissage Par Renforcement

Zhongwei Wan, Yun Shen, Zhihao Dou, et al.

Mobile-O : Compréhension et génération multimodale unifiées sur appareil mobile

Mobile-O : Compréhension et génération multimodale unifiées sur appareil mobile

Modèle De Diffusion

Abdelrahman Shaker, Ahmed Heakl, Jaseel Muhammad, et al.

TOPReward : Probabilités de tokens comme récompenses cachées zéro-shot pour la robotique

TOPReward : Probabilités de tokens comme récompenses cachées zéro-shot pour la robotique

Apprentissage Par Renforcement

Représentation Multimodale

Shirui Chen, Cole Harrison, Ying-Chun Lee, et al.

ManCAR : Raisonnement latent contraint par variété avec calcul adaptatif en temps de test pour la recommandation séquentielle

ManCAR : Raisonnement latent contraint par variété avec calcul adaptatif en temps de test pour la recommandation séquentielle

Modélisation Des Préférences

Apprentissage Multi-tâches

Kun Yang, Yuxuan Zhu, Yazhe Chen, et al.

VLANeXt : Des Recettes pour Construire des Modèles VLA Robustes

VLANeXt : Des Recettes pour Construire des Modèles VLA Robustes

Représentation Multimodale

Xiao-Ming Wu, Bin Fan, Kang Liao, et al.

Un très grand ensemble de raisonnement vidéo

Un très grand ensemble de raisonnement vidéo

Compréhension Vidéo

Maijunxian Wang, Ruisi Wang, Juyi Lin, et al.

Entraînement sélectif des grands modèles vision-langage par gain d'information visuelle

Entraînement sélectif des grands modèles vision-langage par gain d'information visuelle

Affinage Supervisé

Seulbi Lee, Sangheum Hwang

DeepVision-103K : Un jeu de données mathématique à large couverture, diversifié visuellement et vérifiable pour le raisonnement multimodal

DeepVision-103K : Un jeu de données mathématique à large couverture, diversifié visuellement et vérifiable pour le raisonnement multimodal

Réponse À Des Questions Visuelles

Haoxiang Sun, Lizhen Xu, Bing Zhao, et al.

SARAH : Humains agents en temps réel sensibles à l'espace

SARAH : Humains agents en temps réel sensibles à l'espace

Représentation Multimodale

Génération 3D

Evonne Ng, Siwei Zhang, Zhang Chen, et al.

EgoPush : Apprentissage d'une réarrangement multi-objets egocentrique bout-en-bout pour les robots mobiles

EgoPush : Apprentissage d'une réarrangement multi-objets egocentrique bout-en-bout pour les robots mobiles

Boyuan An, Zhexiong Wang, Yipeng Wang, et al.

Realité générée : simulation du monde centrée sur l’humain à l’aide de la génération vidéo interactive avec contrôle de la main et de la caméra

Realité générée : simulation du monde centrée sur l’humain à l’aide de la génération vidéo interactive avec contrôle de la main et de la caméra

Modèle De Diffusion

Génération De Vidéo

Linxi Xie, Lisong C. Sun, Ashley Neall, et al.

VESPO : Optimisation Variationnelle de Politique Douce au Niveau de la Séquence pour une Formation Stable des LLM en Mode Hors-Échantillonnage

VESPO : Optimisation Variationnelle de Politique Douce au Niveau de la Séquence pour une Formation Stable des LLM en Mode Hors-Échantillonnage

Apprentissage Par Renforcement

Guobin Shen, Chenxiao Zhao, Xiang Cheng, et al.

Rapport technique Arcee Trinity

Rapport technique Arcee Trinity

Varun Singh, Lucas Krauss, Sami Jaghouar, et al.

Cadre pratique de gestion des risques de l’IA de pointe : Rapport technique d’analyse des risques v1.5

Cadre pratique de gestion des risques de l’IA de pointe : Rapport technique d’analyse des risques v1.5

Dongrui Liu, Yi Yu, Jie Zhang, et al.

Latents unifiés (UL) : Comment entraîner vos latents

Latents unifiés (UL) : Comment entraîner vos latents

Modèle De Diffusion

Génération D'images

Jonathan Heek, Emiel Hoogeboom, Thomas Mensink, et al.

Mobile-Agent-v3.5 : Agents fondamentaux GUI multiplateformes

Mobile-Agent-v3.5 : Agents fondamentaux GUI multiplateformes

Haiyang Xu, Xi Zhang, Haowei Liu, et al.

SpargeAttention2 : Une attention creuse entraînable grâce au masquage hybride Top-k+Top-p et au fine-tuning par distillation

SpargeAttention2 : Une attention creuse entraînable grâce au masquage hybride Top-k+Top-p et au fine-tuning par distillation

Modèle De Diffusion

Jintao Zhang, Kai Jiang, Chendong Xiang, et al.

AutoWebWorld : Synthétisation d’environnements web vérifiables infinis via des machines à états finies

AutoWebWorld : Synthétisation d’environnements web vérifiables infinis via des machines à états finies

Génération 3D

Yifan Wu, Yiran Peng, Yiyu Chen, et al.

Vérification de Modèles Bornée pour des Systèmes Client-Serveur Non Bornés

Vérification de Modèles Bornée pour des Systèmes Client-Serveur Non Bornés

Apprentissage Profond

Ramchandra Phawade, Tephilla Prince, S. Sheerazuddin

Combien de raisonnement les modèles améliorés par récupération ajoutent-ils au-delà des LLM ? Un cadre d'évaluation pour l'inférence multi-sauts sur un savoir hybride

Combien de raisonnement les modèles améliorés par récupération ajoutent-ils au-delà des LLM ? Un cadre d'évaluation pour l'inférence multi-sauts sur un savoir hybride

Génération Augmentée Par La Recherche

Junhong Lin, Bing Zhang, Song Wang, et al.