HyperAI

Principal

GPU

Console
Studio
Docs
Tarifs

Pulse

Actualités

Ressources

Publications de recherche
Notebooks
Jeux de données
Wiki

Benchmarks

SOTA
Modèles LLM
Classement des GPU

Communauté

Événements

Utilitaires

À propos Conditions d’utilisation Politique de confidentialité
Français

Command Palette

Search for a command to run...

HyperAI
Papers

Papers

Articles de recherche en IA de pointe mis à jour quotidiennement pour vous aider à suivre les dernières tendances en IA

Construire l’avenir de l’intelligence artificielle

À propos

À propos Support Aide relative au jeu de données

Produits

Actualités Publications de recherche Notebooks Jeux de données Wiki

Liens

© HyperAI

GitHub Discord X (formerly Twitter)

HyperAI

Principal

GPU

Console
Studio
Docs
Tarifs

Pulse

Actualités

Ressources

Publications de recherche
Notebooks
Jeux de données
Wiki

Benchmarks

SOTA
Modèles LLM
Classement des GPU

Communauté

Événements

Utilitaires

À propos Conditions d’utilisation Politique de confidentialité
Français

Command Palette

Search for a command to run...

HyperAI
Papers

Papers

Articles de recherche en IA de pointe mis à jour quotidiennement pour vous aider à suivre les dernières tendances en IA

Construire l’avenir de l’intelligence artificielle

À propos

À propos Support Aide relative au jeu de données

Produits

Actualités Publications de recherche Notebooks Jeux de données Wiki

Liens

© HyperAI

GitHub Discord X (formerly Twitter)

PHUMA : Jeu de données de locomotion humanoïde fondé sur le physique

PHUMA : Jeu de données de locomotion humanoïde fondé sur le physique

Jeu De Données

Kyungmin Lee, Sibeen Kim, Minho Park, et al.

UniREditBench : Un benchmark d'édition d'images fondé sur le raisonnement unifié

UniREditBench : Un benchmark d'édition d'images fondé sur le raisonnement unifié

Feng Han, Yibin Wang, Chenglin Li, et al.

Généralisation de l'échelle optimale du calcul au moment du test sous forme de graphe optimisable

Fali Wang, Jihai Chen, Shuhua Yang, et al.

UniLumos : Relumière rapide et unifiée d'images et de vidéos avec une rétroaction physiquement plausible

Modèle De Diffusion

Estimation De Profondeur

Ropeway Liu, Hangjie Yuan, Bo Dong, et al.

Le pouvoir sous-estimé des modèles de vision pour la compréhension de la structure des graphes

Vision Par Ordinateur

Xinjian Zhao, Wei Pang, Zhongkai Xue, et al.

Chaque activation boostée : mise à l’échelle du raisonneur général à 1 billion de fondamentaux linguistiques ouverts

Ling-Team, Ang Li, Ben Liu, et al.

NOBLE - Opérateur neuronal à embeddings latents inspirés de la biologie pour capturer la variabilité expérimentale dans les modèles neuronaux biologiques

Apprentissage Profond

Luca Ghafourpour, Valentin Duruisseaux, Bahareh Tolooshams, et al.

Glia : une IA inspirée de l'humain pour la conception et l'optimisation automatisées des systèmes

Pouya Hamadanian, Pantea Karimi, Arash Nasr-Esfahany, et al.

Ingénierie du contexte 2.0 : Le contexte de l'ingénierie du contexte

Intelligence Artificielle

Qishuo Hua, Lyumanshan Ye, Dayuan Fu, et al.

Spatial-SSRL : Amélioration de la compréhension spatiale par apprentissage par renforcement auto-supervisé

Compréhension D'images

Vision Par Ordinateur

Yuhong Liu, Beichen Zhang, Yuhang Zang, et al.

Modèles de langage autorégressifs continus

Génération De Texte

Chenze Shao, Darren Li, Fandong Meng, et al.

$π_{\text{RL}}$ : Affinage en ligne par apprentissage par renforcement pour les modèles vision-langage-action fondés sur les flux

Apprentissage Par Renforcement

Affinage Supervisé

Kang Chen, Zhihao Liu, Tonghe Zhang, et al.

INT contre FP : Une étude approfondie des formats de quantification à faible précision et fine granularité

Mengzhao Chen, Meng Wu, Hui Jin, et al.

ThinkMorph : Propriétés émergentes dans le raisonnement en chaîne de pensée multimodal entrelacé

Jiawei Gu, Yunzhuo Hao, Huichen Will Wang, et al.

OS-Sentinel : Vers des agents GUI mobiles à sécurité renforcée grâce à une validation hybride dans des flux de travail réalistes

Qiushi Sun, Mukai Li, Zhoumianze Liu, et al.

L'ère de l'organisation agente : Apprendre à organiser avec les modèles linguistiques

Zewen Chi, Li Dong, Qingxiu Dong, et al.

SPICE : l'apprentissage par auto-jeu dans des environnements de corpus améliore le raisonnement

Apprentissage Par Renforcement

Bo Liu, Chuanyang Jin, Seungone Kim, et al.

Surfer 2 : La prochaine génération d'agents informatiques multiplateformes

Interaction Homme-Machine

Mathieu Andreux, Märt Bakler, Yanael Barbier, et al.

Exploration des conditions des modèles de diffusion en contrôle robotique

Modèle De Diffusion

Heeseong Shin, Byeongho Heo, Dongyoon Han, et al.

Peut un agent maîtriser le web ? Exploration des frontières de l'agent ChatGPT Atlas dans les jeux web

Jingran Zhang, Ning Li, Justin Cui

Kimi Linear : une architecture d'attention expressive et efficace

Kimi Team, Yu Zhang, Zongyu Lin, et al.

Emu3.5 : les modèles multimodaux natifs sont des apprenants du monde

Yufeng Cui, Honghao Chen, Haoge Deng, et al.

La fin du décodage manuel : vers des modèles linguistiques véritablement end-to-end

Zhichao Wang, Dongyang Ma, Xinting Huang, et al.

Complémentarité homme-IA : une cible pour un contrôle renforcé

Interaction Homme-Machine

Traitement Du Langage Naturel

Rishub Jain, Sophie Bridgers, Lili Janzer, et al.

GPTOpt : Vers une optimisation par boîte noire basée sur les grands modèles linguistiques efficace

Affinage Supervisé

Jamison Meindl, Yunsheng Tian, Tony Cui, et al.

VFXMaster : Déverrouiller la génération de effets visuels dynamiques grâce à l'apprentissage in-context

Génération De Vidéo

Image Vers Vidéo

Baolu Li, Yiming Zhang, Qinghe Wang, et al.

GRPO conscient des raisonnements utilisant le mining de processus

Apprentissage Par Renforcement

Taekhyun Park, Yongjae Lee, Hyerim Bae

Échelle du raisonnement latent par modèles linguistiques bouclés

Rui-Jie Zhu, Zixuan Wang, Kai Hua, et al.

ReForm : autoformalisation réfléchie avec optimisation séquentielle à bornes prospectives

Guoxin Chen, Jing Wu, Xinjie Chen, et al.

Video-Thinker : Déclencher la « pensée à travers les vidéos » grâce à l'apprentissage par renforcement

Compréhension Vidéo

Shijian Wang, Jiarui Jin, Xingjian Wang, et al.

JanusCoder : Vers une interface fondamentale visuelle et programmatique pour l'intelligence du code

Génération De Code

Qiushi Sun, Jingyang Gong, Yang Liu, et al.

MCP-Flow : Faciliter aux agents LLM à maîtriser des outils MCP réels, diversifiés et évolutifs

Wenhao Wang, Peizhi Niu, Zhao Xu, et al.

PHUMA : Jeu de données de locomotion humanoïde fondé sur le physique

PHUMA : Jeu de données de locomotion humanoïde fondé sur le physique

Jeu De Données

Kyungmin Lee, Sibeen Kim, Minho Park, et al.

UniREditBench : Un benchmark d'édition d'images fondé sur le raisonnement unifié

UniREditBench : Un benchmark d'édition d'images fondé sur le raisonnement unifié

Feng Han, Yibin Wang, Chenglin Li, et al.

Généralisation de l'échelle optimale du calcul au moment du test sous forme de graphe optimisable

Fali Wang, Jihai Chen, Shuhua Yang, et al.

UniLumos : Relumière rapide et unifiée d'images et de vidéos avec une rétroaction physiquement plausible

Modèle De Diffusion

Estimation De Profondeur

Ropeway Liu, Hangjie Yuan, Bo Dong, et al.

Le pouvoir sous-estimé des modèles de vision pour la compréhension de la structure des graphes

Vision Par Ordinateur

Xinjian Zhao, Wei Pang, Zhongkai Xue, et al.

Chaque activation boostée : mise à l’échelle du raisonneur général à 1 billion de fondamentaux linguistiques ouverts

Ling-Team, Ang Li, Ben Liu, et al.

NOBLE - Opérateur neuronal à embeddings latents inspirés de la biologie pour capturer la variabilité expérimentale dans les modèles neuronaux biologiques

Apprentissage Profond

Luca Ghafourpour, Valentin Duruisseaux, Bahareh Tolooshams, et al.

Glia : une IA inspirée de l'humain pour la conception et l'optimisation automatisées des systèmes

Pouya Hamadanian, Pantea Karimi, Arash Nasr-Esfahany, et al.

Ingénierie du contexte 2.0 : Le contexte de l'ingénierie du contexte

Intelligence Artificielle

Qishuo Hua, Lyumanshan Ye, Dayuan Fu, et al.

Spatial-SSRL : Amélioration de la compréhension spatiale par apprentissage par renforcement auto-supervisé

Compréhension D'images

Vision Par Ordinateur

Yuhong Liu, Beichen Zhang, Yuhang Zang, et al.

Modèles de langage autorégressifs continus

Génération De Texte

Chenze Shao, Darren Li, Fandong Meng, et al.

$π_{\text{RL}}$ : Affinage en ligne par apprentissage par renforcement pour les modèles vision-langage-action fondés sur les flux

Apprentissage Par Renforcement

Affinage Supervisé

Kang Chen, Zhihao Liu, Tonghe Zhang, et al.

INT contre FP : Une étude approfondie des formats de quantification à faible précision et fine granularité

Mengzhao Chen, Meng Wu, Hui Jin, et al.

ThinkMorph : Propriétés émergentes dans le raisonnement en chaîne de pensée multimodal entrelacé

Jiawei Gu, Yunzhuo Hao, Huichen Will Wang, et al.

OS-Sentinel : Vers des agents GUI mobiles à sécurité renforcée grâce à une validation hybride dans des flux de travail réalistes

Qiushi Sun, Mukai Li, Zhoumianze Liu, et al.

L'ère de l'organisation agente : Apprendre à organiser avec les modèles linguistiques

Zewen Chi, Li Dong, Qingxiu Dong, et al.

SPICE : l'apprentissage par auto-jeu dans des environnements de corpus améliore le raisonnement

Apprentissage Par Renforcement

Bo Liu, Chuanyang Jin, Seungone Kim, et al.

Surfer 2 : La prochaine génération d'agents informatiques multiplateformes

Interaction Homme-Machine

Mathieu Andreux, Märt Bakler, Yanael Barbier, et al.

Exploration des conditions des modèles de diffusion en contrôle robotique

Modèle De Diffusion

Heeseong Shin, Byeongho Heo, Dongyoon Han, et al.

Peut un agent maîtriser le web ? Exploration des frontières de l'agent ChatGPT Atlas dans les jeux web

Jingran Zhang, Ning Li, Justin Cui

Kimi Linear : une architecture d'attention expressive et efficace

Kimi Team, Yu Zhang, Zongyu Lin, et al.

Emu3.5 : les modèles multimodaux natifs sont des apprenants du monde

Yufeng Cui, Honghao Chen, Haoge Deng, et al.

La fin du décodage manuel : vers des modèles linguistiques véritablement end-to-end

Zhichao Wang, Dongyang Ma, Xinting Huang, et al.

Complémentarité homme-IA : une cible pour un contrôle renforcé

Interaction Homme-Machine

Traitement Du Langage Naturel

Rishub Jain, Sophie Bridgers, Lili Janzer, et al.

GPTOpt : Vers une optimisation par boîte noire basée sur les grands modèles linguistiques efficace

Affinage Supervisé

Jamison Meindl, Yunsheng Tian, Tony Cui, et al.

VFXMaster : Déverrouiller la génération de effets visuels dynamiques grâce à l'apprentissage in-context

Génération De Vidéo

Image Vers Vidéo

Baolu Li, Yiming Zhang, Qinghe Wang, et al.

GRPO conscient des raisonnements utilisant le mining de processus

Apprentissage Par Renforcement

Taekhyun Park, Yongjae Lee, Hyerim Bae

Échelle du raisonnement latent par modèles linguistiques bouclés

Rui-Jie Zhu, Zixuan Wang, Kai Hua, et al.

ReForm : autoformalisation réfléchie avec optimisation séquentielle à bornes prospectives

Guoxin Chen, Jing Wu, Xinjie Chen, et al.

Video-Thinker : Déclencher la « pensée à travers les vidéos » grâce à l'apprentissage par renforcement

Compréhension Vidéo

Shijian Wang, Jiarui Jin, Xingjian Wang, et al.

JanusCoder : Vers une interface fondamentale visuelle et programmatique pour l'intelligence du code

Génération De Code

Qiushi Sun, Jingyang Gong, Yang Liu, et al.

MCP-Flow : Faciliter aux agents LLM à maîtriser des outils MCP réels, diversifiés et évolutifs

Wenhao Wang, Peizhi Niu, Zhao Xu, et al.

Généralisation de l'échelle optimale du calcul au moment du test sous forme de graphe optimisable

UniLumos : Relumière rapide et unifiée d'images et de vidéos avec une rétroaction physiquement plausible

Le pouvoir sous-estimé des modèles de vision pour la compréhension de la structure des graphes

Chaque activation boostée : mise à l’échelle du raisonneur général à 1 billion de fondamentaux linguistiques ouverts

NOBLE - Opérateur neuronal à embeddings latents inspirés de la biologie pour capturer la variabilité expérimentale dans les modèles neuronaux biologiques

Glia : une IA inspirée de l'humain pour la conception et l'optimisation automatisées des systèmes

Ingénierie du contexte 2.0 : Le contexte de l'ingénierie du contexte

Spatial-SSRL : Amélioration de la compréhension spatiale par apprentissage par renforcement auto-supervisé

Modèles de langage autorégressifs continus

$π_{\text{RL}}$ : Affinage en ligne par apprentissage par renforcement pour les modèles vision-langage-action fondés sur les flux

INT contre FP : Une étude approfondie des formats de quantification à faible précision et fine granularité

ThinkMorph : Propriétés émergentes dans le raisonnement en chaîne de pensée multimodal entrelacé

OS-Sentinel : Vers des agents GUI mobiles à sécurité renforcée grâce à une validation hybride dans des flux de travail réalistes

L'ère de l'organisation agente : Apprendre à organiser avec les modèles linguistiques

SPICE : l'apprentissage par auto-jeu dans des environnements de corpus améliore le raisonnement

Surfer 2 : La prochaine génération d'agents informatiques multiplateformes

Exploration des conditions des modèles de diffusion en contrôle robotique

Peut un agent maîtriser le web ? Exploration des frontières de l'agent ChatGPT Atlas dans les jeux web

Kimi Linear : une architecture d'attention expressive et efficace

Emu3.5 : les modèles multimodaux natifs sont des apprenants du monde

La fin du décodage manuel : vers des modèles linguistiques véritablement end-to-end

Complémentarité homme-IA : une cible pour un contrôle renforcé

GPTOpt : Vers une optimisation par boîte noire basée sur les grands modèles linguistiques efficace

VFXMaster : Déverrouiller la génération de effets visuels dynamiques grâce à l'apprentissage in-context

GRPO conscient des raisonnements utilisant le mining de processus

Échelle du raisonnement latent par modèles linguistiques bouclés

ReForm : autoformalisation réfléchie avec optimisation séquentielle à bornes prospectives

Video-Thinker : Déclencher la « pensée à travers les vidéos » grâce à l'apprentissage par renforcement

JanusCoder : Vers une interface fondamentale visuelle et programmatique pour l'intelligence du code

MCP-Flow : Faciliter aux agents LLM à maîtriser des outils MCP réels, diversifiés et évolutifs

Généralisation de l'échelle optimale du calcul au moment du test sous forme de graphe optimisable

UniLumos : Relumière rapide et unifiée d'images et de vidéos avec une rétroaction physiquement plausible

Le pouvoir sous-estimé des modèles de vision pour la compréhension de la structure des graphes

Chaque activation boostée : mise à l’échelle du raisonneur général à 1 billion de fondamentaux linguistiques ouverts

NOBLE - Opérateur neuronal à embeddings latents inspirés de la biologie pour capturer la variabilité expérimentale dans les modèles neuronaux biologiques

Glia : une IA inspirée de l'humain pour la conception et l'optimisation automatisées des systèmes

Ingénierie du contexte 2.0 : Le contexte de l'ingénierie du contexte

Spatial-SSRL : Amélioration de la compréhension spatiale par apprentissage par renforcement auto-supervisé

Modèles de langage autorégressifs continus

$π_{\text{RL}}$ : Affinage en ligne par apprentissage par renforcement pour les modèles vision-langage-action fondés sur les flux

INT contre FP : Une étude approfondie des formats de quantification à faible précision et fine granularité

ThinkMorph : Propriétés émergentes dans le raisonnement en chaîne de pensée multimodal entrelacé

OS-Sentinel : Vers des agents GUI mobiles à sécurité renforcée grâce à une validation hybride dans des flux de travail réalistes

L'ère de l'organisation agente : Apprendre à organiser avec les modèles linguistiques

SPICE : l'apprentissage par auto-jeu dans des environnements de corpus améliore le raisonnement

Surfer 2 : La prochaine génération d'agents informatiques multiplateformes

Exploration des conditions des modèles de diffusion en contrôle robotique

Peut un agent maîtriser le web ? Exploration des frontières de l'agent ChatGPT Atlas dans les jeux web

Kimi Linear : une architecture d'attention expressive et efficace

Emu3.5 : les modèles multimodaux natifs sont des apprenants du monde

La fin du décodage manuel : vers des modèles linguistiques véritablement end-to-end

Complémentarité homme-IA : une cible pour un contrôle renforcé

GPTOpt : Vers une optimisation par boîte noire basée sur les grands modèles linguistiques efficace

VFXMaster : Déverrouiller la génération de effets visuels dynamiques grâce à l'apprentissage in-context

GRPO conscient des raisonnements utilisant le mining de processus

Échelle du raisonnement latent par modèles linguistiques bouclés

ReForm : autoformalisation réfléchie avec optimisation séquentielle à bornes prospectives

Video-Thinker : Déclencher la « pensée à travers les vidéos » grâce à l'apprentissage par renforcement

JanusCoder : Vers une interface fondamentale visuelle et programmatique pour l'intelligence du code

MCP-Flow : Faciliter aux agents LLM à maîtriser des outils MCP réels, diversifiés et évolutifs