HyperAI

Principal

GPU

Console
Studio
Docs
Tarifs

Pulse

Actualités

Ressources

Publications de recherche
Notebooks
Jeux de données
Wiki

Benchmarks

SOTA
Modèles LLM
Classement des GPU

Communauté

Événements

Utilitaires

À propos Conditions d’utilisation Politique de confidentialité
Français

Command Palette

Search for a command to run...

HyperAI
Papers

Papers

Articles de recherche en IA de pointe mis à jour quotidiennement pour vous aider à suivre les dernières tendances en IA

Construire l’avenir de l’intelligence artificielle

À propos

À propos Support Aide relative au jeu de données

Produits

Actualités Publications de recherche Notebooks Jeux de données Wiki

Liens

© HyperAI

GitHub Discord X (formerly Twitter)

HyperAI

Principal

GPU

Console
Studio
Docs
Tarifs

Pulse

Actualités

Ressources

Publications de recherche
Notebooks
Jeux de données
Wiki

Benchmarks

SOTA
Modèles LLM
Classement des GPU

Communauté

Événements

Utilitaires

À propos Conditions d’utilisation Politique de confidentialité
Français

Command Palette

Search for a command to run...

HyperAI
Papers

Papers

Articles de recherche en IA de pointe mis à jour quotidiennement pour vous aider à suivre les dernières tendances en IA

Construire l’avenir de l’intelligence artificielle

À propos

À propos Support Aide relative au jeu de données

Produits

Actualités Publications de recherche Notebooks Jeux de données Wiki

Liens

© HyperAI

GitHub Discord X (formerly Twitter)

Rapport technique VibeVoice

Rapport technique VibeVoice

Zhiliang Peng, Jianwei Yu, Wenhui Wang, et al.

MMTok : Maximisation de la couverture multimodale pour une inférence efficace des modèles de vision et de langage

MMTok : Maximisation de la couverture multimodale pour une inférence efficace des modèles de vision et de langage

Représentation Multimodale

Sixun Dong, Juhua Hu, Mian Zhang, et al.

MV-RAG : diffusion multivue augmentée par récupération

Génération 3D

Modèle De Diffusion

Yosef Dayani, Omer Benishu, Sagie Benaim

Connecter la synthèse des frameworks organométalliques à leurs applications à l’aide d’un apprentissage automatique multimodal

Apprentissage Profond

Sartaaj Takrim Khan, Seyed Mohamad Moosavi

Protocoles de contexte de modèle dans les systèmes de transport adaptatifs : Une revue

Gaurab Chhetri, Shriyank Somvanshi, Md Monzurul Islam, et al.

Action collective algorithmique avec plusieurs collectifs

Classification Des Sentiments

Claudio Battiloro, Pietro Greiner, Bret Nestor, Oumaima Amezgar, Francesca Dominici

OpenCUA : Fondations ouvertes pour les agents d'utilisation informatique

Jeu De Données

Xinyuan Wang, Bowen Wang, Dunjie Lu, et al.

Politique spatiale : orienter la manipulation robotique visuomotrice par une modélisation et un raisonnement sensibles à l'espace

Intelligence Incarnée

Yijun Liu, Yuwei Liu, Yuan Meng, et al.

Jet-Nemotron : Modèle linguistique efficace basé sur une recherche post-architecturale neuronale

Yuxian Gu, Qinghao Hu, Shang Yang, et al.

CRISP : Désapprentissage de concepts persistants par autoencodeurs creux

Tomer Ashuach, Dana Arad, Aaron Mueller, et al.

Apprentissage contrastif sélectif pour l'ancrage d'aptitudes sous supervision faible

Vision Par Ordinateur

Reconnaissance D'images

WonJun Moon, Hyun Seok Seong, Jae-Pil Heo

EgoTwin : Corps et vue en première personne dans le rêve

Génération De Vidéo

Texte Vers Vidéo

Jingqiao Xiu, Fangzhou Hong, Yicong Li, et al.

Au-delà de Pass@1 : le self-play avec une synthèse variationnelle de problèmes soutient le RLVR

Apprentissage Par Renforcement

Xiao Liang, Zhongzhi Li, Yeyun Gong, et al.

ODYSSEY : Exploration et manipulation des quadrupèdes dans un monde ouvert pour des tâches à horizon long

Intelligence Incarnée

Kaijun Wang, Liqin Lu, Mingyu Liu, et al.

AgentFly : Affiner les agents de LLMS sans affiner les LLMS

Apprentissage Par Renforcement

Huichi Zhou, Yihang Chen, Siyuan Guo, et al.

Raisonneur de diffusion guidé par des contraintes pour l'apprentissage neuro-symbole

Apprentissage Profond

Xuan Zhang, Zhijian Zhou, Weidi Xu, et al.

Les agents fondés sur les LLM pour la cartographie du paysage concurrentiel dans le cadre de l'analyse approfondie des actifs pharmaceutiques

Compréhension De Document

Alisa Vinogradova, Vlad Vinogradov, Dmitrii Radkevich, et al.

SceneGen : Génération de scènes 3D à partir d'une seule image en une seule passe d'avant-progression

Génération 3D

Yanxu Meng, Haoning Wu, Ya Zhang, et al.

Une revue sur les benchmarks des grands modèles linguistiques

Jeu De Données

Shiwen Ni, Guhong Chen, Shuaimin Li, et al.

Waver : Ondulez votre chemin vers la génération vidéo réaliste

Image Vers Vidéo

Texte Vers Vidéo

Yifu Zhang, Hao Yang, Yuqi Zhang, et al.

LiveMCP-101 : Tests de charge et diagnostic des agents pilotés par MCP sur des requêtes complexes

Ming Yin, Dinghan Shen, Silei Xu, et al.

Pensez profondément avec assurance

Yichao Fu, Xuewei Wang, Yuandong Tian, et al.

Mobile-Agent-v3 : Agents fondamentaux pour l'automatisation des interfaces graphiques

Jiabo Ye, Xi Zhang, Haiyang Xu, et al.

Intern-S1 : un modèle fondamental multimodal scientifique

Lei Bai, Zhongrui Cai, Maosong Cao, et al.

Ajustement guidé par le langage : amélioration de l'optimisation numérique grâce aux retours textuels

Yuxing Lu, Yucheng Hu, Nan Sun, et al.

NiceWebRL : une bibliothèque Python pour les expériences avec sujets humains dans des environnements d'apprentissage par renforcement

Apprentissage Par Renforcement

Interaction Homme-Machine

Wilka Carvalho, Vikram Goddla, Ishaan Sinha, et al.

Du traitement de l'information scientifique par l'intelligence artificielle à la science agente : une revue sur la découverte scientifique autonome

IA Pour La Science

Jiaqi Wei, Yuejin Yang, Xiang Zhang, et al.

MeshCoder : Génération de code de maillage structuré par LLM à partir de nuages de points

Génération De Code

Bingquan Dai, Li Ray Luo, Qihong Tang, et al.

Tinker : Le don de la diffusion à l'édition 3D cohérente sur plusieurs vues à partir d'entrées éparses sans optimisation par scène

Modèle De Diffusion

Canyu Zhao, Xiaoman Li, Tianjian Feng, et al.

FutureX : un benchmark en temps réel avancé pour les agents LLM dans la prédiction de l'avenir

Zhiyuan Zeng, Jiashuo Liu, Siyuan Chen, et al.

DuPO : Permettre une auto-vérification fiable des grands modèles linguistiques grâce à une optimisation par préférences duals

Affinage Supervisé

Modélisation Des Préférences

Shuaijie She, Yu Bao, Yu Lu, et al.

Des notes aux compétences : un cadre de diagnostic cognitif pour évaluer les grands modèles linguistiques financiers

Jeu De Données

Ziyan Kuang, Feiyu Zhu, Maowei Jiang, et al.

Rapport technique VibeVoice

Rapport technique VibeVoice

Zhiliang Peng, Jianwei Yu, Wenhui Wang, et al.

MMTok : Maximisation de la couverture multimodale pour une inférence efficace des modèles de vision et de langage

MMTok : Maximisation de la couverture multimodale pour une inférence efficace des modèles de vision et de langage

Représentation Multimodale

Sixun Dong, Juhua Hu, Mian Zhang, et al.

MV-RAG : diffusion multivue augmentée par récupération

Génération 3D

Modèle De Diffusion

Yosef Dayani, Omer Benishu, Sagie Benaim

Connecter la synthèse des frameworks organométalliques à leurs applications à l’aide d’un apprentissage automatique multimodal

Apprentissage Profond

Sartaaj Takrim Khan, Seyed Mohamad Moosavi

Protocoles de contexte de modèle dans les systèmes de transport adaptatifs : Une revue

Gaurab Chhetri, Shriyank Somvanshi, Md Monzurul Islam, et al.

Action collective algorithmique avec plusieurs collectifs

Classification Des Sentiments

Claudio Battiloro, Pietro Greiner, Bret Nestor, Oumaima Amezgar, Francesca Dominici

OpenCUA : Fondations ouvertes pour les agents d'utilisation informatique

Jeu De Données

Xinyuan Wang, Bowen Wang, Dunjie Lu, et al.

Politique spatiale : orienter la manipulation robotique visuomotrice par une modélisation et un raisonnement sensibles à l'espace

Intelligence Incarnée

Yijun Liu, Yuwei Liu, Yuan Meng, et al.

Jet-Nemotron : Modèle linguistique efficace basé sur une recherche post-architecturale neuronale

Yuxian Gu, Qinghao Hu, Shang Yang, et al.

CRISP : Désapprentissage de concepts persistants par autoencodeurs creux

Tomer Ashuach, Dana Arad, Aaron Mueller, et al.

Apprentissage contrastif sélectif pour l'ancrage d'aptitudes sous supervision faible

Vision Par Ordinateur

Reconnaissance D'images

WonJun Moon, Hyun Seok Seong, Jae-Pil Heo

EgoTwin : Corps et vue en première personne dans le rêve

Génération De Vidéo

Texte Vers Vidéo

Jingqiao Xiu, Fangzhou Hong, Yicong Li, et al.

Au-delà de Pass@1 : le self-play avec une synthèse variationnelle de problèmes soutient le RLVR

Apprentissage Par Renforcement

Xiao Liang, Zhongzhi Li, Yeyun Gong, et al.

ODYSSEY : Exploration et manipulation des quadrupèdes dans un monde ouvert pour des tâches à horizon long

Intelligence Incarnée

Kaijun Wang, Liqin Lu, Mingyu Liu, et al.

AgentFly : Affiner les agents de LLMS sans affiner les LLMS

Apprentissage Par Renforcement

Huichi Zhou, Yihang Chen, Siyuan Guo, et al.

Raisonneur de diffusion guidé par des contraintes pour l'apprentissage neuro-symbole

Apprentissage Profond

Xuan Zhang, Zhijian Zhou, Weidi Xu, et al.

Les agents fondés sur les LLM pour la cartographie du paysage concurrentiel dans le cadre de l'analyse approfondie des actifs pharmaceutiques

Compréhension De Document

Alisa Vinogradova, Vlad Vinogradov, Dmitrii Radkevich, et al.

SceneGen : Génération de scènes 3D à partir d'une seule image en une seule passe d'avant-progression

Génération 3D

Yanxu Meng, Haoning Wu, Ya Zhang, et al.

Une revue sur les benchmarks des grands modèles linguistiques

Jeu De Données

Shiwen Ni, Guhong Chen, Shuaimin Li, et al.

Waver : Ondulez votre chemin vers la génération vidéo réaliste

Image Vers Vidéo

Texte Vers Vidéo

Yifu Zhang, Hao Yang, Yuqi Zhang, et al.

LiveMCP-101 : Tests de charge et diagnostic des agents pilotés par MCP sur des requêtes complexes

Ming Yin, Dinghan Shen, Silei Xu, et al.

Pensez profondément avec assurance

Yichao Fu, Xuewei Wang, Yuandong Tian, et al.

Mobile-Agent-v3 : Agents fondamentaux pour l'automatisation des interfaces graphiques

Jiabo Ye, Xi Zhang, Haiyang Xu, et al.

Intern-S1 : un modèle fondamental multimodal scientifique

Lei Bai, Zhongrui Cai, Maosong Cao, et al.

Ajustement guidé par le langage : amélioration de l'optimisation numérique grâce aux retours textuels

Yuxing Lu, Yucheng Hu, Nan Sun, et al.

NiceWebRL : une bibliothèque Python pour les expériences avec sujets humains dans des environnements d'apprentissage par renforcement

Apprentissage Par Renforcement

Interaction Homme-Machine

Wilka Carvalho, Vikram Goddla, Ishaan Sinha, et al.

Du traitement de l'information scientifique par l'intelligence artificielle à la science agente : une revue sur la découverte scientifique autonome

IA Pour La Science

Jiaqi Wei, Yuejin Yang, Xiang Zhang, et al.

MeshCoder : Génération de code de maillage structuré par LLM à partir de nuages de points

Génération De Code

Bingquan Dai, Li Ray Luo, Qihong Tang, et al.

Tinker : Le don de la diffusion à l'édition 3D cohérente sur plusieurs vues à partir d'entrées éparses sans optimisation par scène

Modèle De Diffusion

Canyu Zhao, Xiaoman Li, Tianjian Feng, et al.

FutureX : un benchmark en temps réel avancé pour les agents LLM dans la prédiction de l'avenir

Zhiyuan Zeng, Jiashuo Liu, Siyuan Chen, et al.

DuPO : Permettre une auto-vérification fiable des grands modèles linguistiques grâce à une optimisation par préférences duals

Affinage Supervisé

Modélisation Des Préférences

Shuaijie She, Yu Bao, Yu Lu, et al.

Des notes aux compétences : un cadre de diagnostic cognitif pour évaluer les grands modèles linguistiques financiers

Jeu De Données

Ziyan Kuang, Feiyu Zhu, Maowei Jiang, et al.

MV-RAG : diffusion multivue augmentée par récupération

Connecter la synthèse des frameworks organométalliques à leurs applications à l’aide d’un apprentissage automatique multimodal

Protocoles de contexte de modèle dans les systèmes de transport adaptatifs : Une revue

Action collective algorithmique avec plusieurs collectifs

OpenCUA : Fondations ouvertes pour les agents d'utilisation informatique

Politique spatiale : orienter la manipulation robotique visuomotrice par une modélisation et un raisonnement sensibles à l'espace

Jet-Nemotron : Modèle linguistique efficace basé sur une recherche post-architecturale neuronale

CRISP : Désapprentissage de concepts persistants par autoencodeurs creux

Apprentissage contrastif sélectif pour l'ancrage d'aptitudes sous supervision faible

EgoTwin : Corps et vue en première personne dans le rêve

Au-delà de Pass@1 : le self-play avec une synthèse variationnelle de problèmes soutient le RLVR

ODYSSEY : Exploration et manipulation des quadrupèdes dans un monde ouvert pour des tâches à horizon long

AgentFly : Affiner les agents de LLMS sans affiner les LLMS

Raisonneur de diffusion guidé par des contraintes pour l'apprentissage neuro-symbole

Les agents fondés sur les LLM pour la cartographie du paysage concurrentiel dans le cadre de l'analyse approfondie des actifs pharmaceutiques

SceneGen : Génération de scènes 3D à partir d'une seule image en une seule passe d'avant-progression

Une revue sur les benchmarks des grands modèles linguistiques

Waver : Ondulez votre chemin vers la génération vidéo réaliste

LiveMCP-101 : Tests de charge et diagnostic des agents pilotés par MCP sur des requêtes complexes

Pensez profondément avec assurance

Mobile-Agent-v3 : Agents fondamentaux pour l'automatisation des interfaces graphiques

Intern-S1 : un modèle fondamental multimodal scientifique

Ajustement guidé par le langage : amélioration de l'optimisation numérique grâce aux retours textuels

NiceWebRL : une bibliothèque Python pour les expériences avec sujets humains dans des environnements d'apprentissage par renforcement

Du traitement de l'information scientifique par l'intelligence artificielle à la science agente : une revue sur la découverte scientifique autonome

MeshCoder : Génération de code de maillage structuré par LLM à partir de nuages de points

Tinker : Le don de la diffusion à l'édition 3D cohérente sur plusieurs vues à partir d'entrées éparses sans optimisation par scène

FutureX : un benchmark en temps réel avancé pour les agents LLM dans la prédiction de l'avenir

DuPO : Permettre une auto-vérification fiable des grands modèles linguistiques grâce à une optimisation par préférences duals

Des notes aux compétences : un cadre de diagnostic cognitif pour évaluer les grands modèles linguistiques financiers

MV-RAG : diffusion multivue augmentée par récupération

Connecter la synthèse des frameworks organométalliques à leurs applications à l’aide d’un apprentissage automatique multimodal

Protocoles de contexte de modèle dans les systèmes de transport adaptatifs : Une revue

Action collective algorithmique avec plusieurs collectifs

OpenCUA : Fondations ouvertes pour les agents d'utilisation informatique

Politique spatiale : orienter la manipulation robotique visuomotrice par une modélisation et un raisonnement sensibles à l'espace

Jet-Nemotron : Modèle linguistique efficace basé sur une recherche post-architecturale neuronale

CRISP : Désapprentissage de concepts persistants par autoencodeurs creux

Apprentissage contrastif sélectif pour l'ancrage d'aptitudes sous supervision faible

EgoTwin : Corps et vue en première personne dans le rêve

Au-delà de Pass@1 : le self-play avec une synthèse variationnelle de problèmes soutient le RLVR

ODYSSEY : Exploration et manipulation des quadrupèdes dans un monde ouvert pour des tâches à horizon long

AgentFly : Affiner les agents de LLMS sans affiner les LLMS

Raisonneur de diffusion guidé par des contraintes pour l'apprentissage neuro-symbole

Les agents fondés sur les LLM pour la cartographie du paysage concurrentiel dans le cadre de l'analyse approfondie des actifs pharmaceutiques

SceneGen : Génération de scènes 3D à partir d'une seule image en une seule passe d'avant-progression

Une revue sur les benchmarks des grands modèles linguistiques

Waver : Ondulez votre chemin vers la génération vidéo réaliste

LiveMCP-101 : Tests de charge et diagnostic des agents pilotés par MCP sur des requêtes complexes

Pensez profondément avec assurance

Mobile-Agent-v3 : Agents fondamentaux pour l'automatisation des interfaces graphiques

Intern-S1 : un modèle fondamental multimodal scientifique

Ajustement guidé par le langage : amélioration de l'optimisation numérique grâce aux retours textuels

NiceWebRL : une bibliothèque Python pour les expériences avec sujets humains dans des environnements d'apprentissage par renforcement

Du traitement de l'information scientifique par l'intelligence artificielle à la science agente : une revue sur la découverte scientifique autonome

MeshCoder : Génération de code de maillage structuré par LLM à partir de nuages de points

Tinker : Le don de la diffusion à l'édition 3D cohérente sur plusieurs vues à partir d'entrées éparses sans optimisation par scène

FutureX : un benchmark en temps réel avancé pour les agents LLM dans la prédiction de l'avenir

DuPO : Permettre une auto-vérification fiable des grands modèles linguistiques grâce à une optimisation par préférences duals

Des notes aux compétences : un cadre de diagnostic cognitif pour évaluer les grands modèles linguistiques financiers