HyperAI

Principal

GPU

Console
Studio
Docs
Tarifs

Pulse

Actualités

Ressources

Publications de recherche
Notebooks
Jeux de données
Wiki

Benchmarks

SOTA
Modèles LLM
Classement des GPU

Communauté

Événements

Utilitaires

À propos Conditions d’utilisation Politique de confidentialité
Français

Command Palette

Search for a command to run...

HyperAI
Papers

Papers

Articles de recherche en IA de pointe mis à jour quotidiennement pour vous aider à suivre les dernières tendances en IA

Construire l’avenir de l’intelligence artificielle

À propos

À propos Support Aide relative au jeu de données

Produits

Actualités Publications de recherche Notebooks Jeux de données Wiki

Liens

© HyperAI

GitHub Discord X (formerly Twitter)

HyperAI

Principal

GPU

Console
Studio
Docs
Tarifs

Pulse

Actualités

Ressources

Publications de recherche
Notebooks
Jeux de données
Wiki

Benchmarks

SOTA
Modèles LLM
Classement des GPU

Communauté

Événements

Utilitaires

À propos Conditions d’utilisation Politique de confidentialité
Français

Command Palette

Search for a command to run...

HyperAI
Papers

Papers

Articles de recherche en IA de pointe mis à jour quotidiennement pour vous aider à suivre les dernières tendances en IA

Construire l’avenir de l’intelligence artificielle

À propos

À propos Support Aide relative au jeu de données

Produits

Actualités Publications de recherche Notebooks Jeux de données Wiki

Liens

© HyperAI

GitHub Discord X (formerly Twitter)

Exploration par proxy et guidage réutilisable : un paradigme modulaire de post-entraînement des LLM via des signaux de mise à jour guidés par proxy

Exploration par proxy et guidage réutilisable : un paradigme modulaire de post-entraînement des LLM via des signaux de mise à jour guidés par proxy

Affinage Supervisé

Daocheng Fu, Rong Wu, Yu Yang, et al.

Vers un réseau neuronal convolutif efficace pour le matériel embarqué via l'élagage multidimensionnel

Vers un réseau neuronal convolutif efficace pour le matériel embarqué via l'élagage multidimensionnel

Réseau De Neurones Convolutif

Hao Kong, Di Liu, Xiangzhong Luo, et al.

Évolution de programmes guidée par LLM pour des attaques ciblées en boîte noire sur les algorithmes de hachage perceptuel

Traitement D'images

Aleksei S. Krylov, Denis S. Rakhov, Veronica Veselova, et al.

Les LLM sont-ils prêts pour HARDCHOICES ?

Modélisation Des Préférences

Dmitry Nikolaev

Prezta : Exécution distante prouvable d'autorisation Zero-Trust à l'aide de SNARKs

Zhongjing Wei, Yupeng Zhang, Osaid Muhammad Ameer, et al.

Distillation par scores uniquement pour la recherche dense compacte

Entraînement Du Modèle

Kirill Dubovikov, Martin Takáč, Salem Lahlou

FAIR GraphRAG : une approche de génération augmentée par récupération pour l'analyse de données sémantiques

Génération Augmentée Par La Recherche

Marlena Fluh, Soo-Yon Kim, Carolin Victoria Schneider, et al.

ManiScope : Analyse visuelle assistée par LLM du risque de manipulation des cryptomonnaies

Xiaolin Wen, Feng Liang, Yuanye Ma, et al.

Décodage neuronal événementiel pour le contrôle moteur neuroprothétique

Apprentissage Profond

Khaleelulla Khan Nazeer, Sirine Arfa, Matthias Jobst, et al.

Libérer chaque expert dans l’entraînement spécifique à un domaine

Affinage Supervisé

Xuefeng Li, Pengfei Liu

EdgeBench : Dévoiler les lois d'échelle de l'apprentissage à partir d'environnements réels

Apprentissage Par Renforcement

Deyao Zhu, Xin Zhou, Shengling Qin, et al.

ARDY : Diffusion autorégressive avec représentation hybride pour la génération interactive de mouvements humains

Modèle De Diffusion

Génération 3D

Kaifeng Zhao, Mathis Petrovich, Haotian Zhang, et al.

PithTrain : un système compact et agent-natif pour l’entraînement de modèles MoE

Entraînement Du Modèle

Ruihang Lai, Hao Kang, Haozhan Tang, et al.

Les modèles de langage ont besoin de sommeil : apprendre à s’auto-modifier et à consolider les souvenirs

Apprentissage Par Renforcement

Ali Behrouz, Farnoosh Hashemi, Adel Javanmard, et al.

HunyuanOCR-1.5 : Rendre les modèles OCR légers de type VLM plus rapides et plus performants

Compréhension De Document

Gengluo Li, Xingyu Wan, Shangpin Peng, et al.

De la génération RVB à la lecture de champs denses : prédiction dense dans l'espace pixel avec des modèles texte-image

Modèle De Diffusion

Estimation De Profondeur

Zanyi Wang, Xin Lin, Haodong Li, et al.

KronQ : Quantification des LLM via la Hessienne factorisée de Kronecker

Donghyun Lee, Yuhang Li, Ruokai Yin, et al.

Distillation de politique par région de confiance

Apprentissage Par Renforcement

Entraînement Du Modèle

Zhengpeng Xie, Li Lyna Zhang, Zeke Xie, et al.

Les modèles de génération vidéo sont des apprenants visuels généralistes

Texte Vers Vidéo

Modèle De Diffusion

Letian Wang, Chuhan Zhang, Rishabh Kabra, et al.

Pré-entraînement visuel évolutif pour l'intelligence linguistique

Yiming Zhang, Zhonghan Zhao, Wenwei Zhang, et al.

Long-Horizon-Terminal-Bench : tester les limites des agents sur des tâches terminales à long horizon avec une évaluation dense basée sur les récompenses

Zongxia Li, Zhongzhi Li, Yucheng Shi, et al.

LLM-comme-tuteur : Adaptation des invites consciente de la politique pour l'apprentissage par renforcement non vérifiable

Apprentissage Par Renforcement

Yujin Kim, Namgyu Ho, Sangmin Hwang, et al.

Graphe de Tâches Atomiques : Un Cadre Unifié pour la Planification et l'Exécution Agentiques

Yue Zhang, Sihan Chen, Ziwen Huang, et al.

LongE2V : Reconstruction, prédiction et interpolation d'images vidéo à long horizon basées sur les événements avec des modèles de diffusion vidéo

Modèle De Diffusion

Génération De Vidéo

Cheng-De Fan, Chun-Wei Tuan Mu, Chen-Wei Chang, et al.

UniClawBench : un banc d’essai universel pour les agents proactifs sur des tâches du monde réel

Zhekai Chen, Chengqi Duan, Kaiyue Sun, et al.

Les idées ont des génomes : évaluation du raisonnement sur les lignées scientifiques et de la génération d'idées fondée sur les lignées

IA Pour La Science

Yifan Zhou, Qihao Yang, Yan Li, et al.

Pourquoi ne puis-je pas ouvrir mon tiroir ? Atténuer les raccourcis orientés objet dans la reconnaissance compositionnelle d'actions en zero-shot

Compréhension Vidéo

Reconnaissance D'action

Geo Ahn, Inwoong Lee, Taeoh Kim, et al.

Video-Oasis : Repenser l'évaluation de la compréhension vidéo

Compréhension Vidéo

Geuntaek Lim, Sungjune Park, Jaeyun Lee, et al.

Vidu S1 : un modèle de génération vidéo interactive en temps réel

Génération De Vidéo

Modèle De Diffusion

Jintao Zhang, Kai Jiang, Jintao Chen, et al.

Mesurer l'écart entre les idées de recherche humaines et celles générées par les LLM

IA Pour La Science

Ziyu Chen, Yilun Zhao, Arman Cohan

L'effet Harness : Comment la conception de l'orchestration définit l'économie des tokens de l'IA agentique d'entreprise

Muayad Sayed Ali, Aliaksandra Novik, Anji Boddupally, et al.

Mondes Infinis aux Interactions Polyvalentes

Génération De Vidéo

Zelin Gao, Qiuyu Wang, Jiapeng Zhu, et al.

Exploration par proxy et guidage réutilisable : un paradigme modulaire de post-entraînement des LLM via des signaux de mise à jour guidés par proxy

Exploration par proxy et guidage réutilisable : un paradigme modulaire de post-entraînement des LLM via des signaux de mise à jour guidés par proxy

Affinage Supervisé

Daocheng Fu, Rong Wu, Yu Yang, et al.

Vers un réseau neuronal convolutif efficace pour le matériel embarqué via l'élagage multidimensionnel

Vers un réseau neuronal convolutif efficace pour le matériel embarqué via l'élagage multidimensionnel

Réseau De Neurones Convolutif

Hao Kong, Di Liu, Xiangzhong Luo, et al.

Évolution de programmes guidée par LLM pour des attaques ciblées en boîte noire sur les algorithmes de hachage perceptuel

Traitement D'images

Aleksei S. Krylov, Denis S. Rakhov, Veronica Veselova, et al.

Les LLM sont-ils prêts pour HARDCHOICES ?

Modélisation Des Préférences

Dmitry Nikolaev

Prezta : Exécution distante prouvable d'autorisation Zero-Trust à l'aide de SNARKs

Zhongjing Wei, Yupeng Zhang, Osaid Muhammad Ameer, et al.

Distillation par scores uniquement pour la recherche dense compacte

Entraînement Du Modèle

Kirill Dubovikov, Martin Takáč, Salem Lahlou

FAIR GraphRAG : une approche de génération augmentée par récupération pour l'analyse de données sémantiques

Génération Augmentée Par La Recherche

Marlena Fluh, Soo-Yon Kim, Carolin Victoria Schneider, et al.

ManiScope : Analyse visuelle assistée par LLM du risque de manipulation des cryptomonnaies

Xiaolin Wen, Feng Liang, Yuanye Ma, et al.

Décodage neuronal événementiel pour le contrôle moteur neuroprothétique

Apprentissage Profond

Khaleelulla Khan Nazeer, Sirine Arfa, Matthias Jobst, et al.

Libérer chaque expert dans l’entraînement spécifique à un domaine

Affinage Supervisé

Xuefeng Li, Pengfei Liu

EdgeBench : Dévoiler les lois d'échelle de l'apprentissage à partir d'environnements réels

Apprentissage Par Renforcement

Deyao Zhu, Xin Zhou, Shengling Qin, et al.

ARDY : Diffusion autorégressive avec représentation hybride pour la génération interactive de mouvements humains

Modèle De Diffusion

Génération 3D

Kaifeng Zhao, Mathis Petrovich, Haotian Zhang, et al.

PithTrain : un système compact et agent-natif pour l’entraînement de modèles MoE

Entraînement Du Modèle

Ruihang Lai, Hao Kang, Haozhan Tang, et al.

Les modèles de langage ont besoin de sommeil : apprendre à s’auto-modifier et à consolider les souvenirs

Apprentissage Par Renforcement

Ali Behrouz, Farnoosh Hashemi, Adel Javanmard, et al.

HunyuanOCR-1.5 : Rendre les modèles OCR légers de type VLM plus rapides et plus performants

Compréhension De Document

Gengluo Li, Xingyu Wan, Shangpin Peng, et al.

De la génération RVB à la lecture de champs denses : prédiction dense dans l'espace pixel avec des modèles texte-image

Modèle De Diffusion

Estimation De Profondeur

Zanyi Wang, Xin Lin, Haodong Li, et al.

KronQ : Quantification des LLM via la Hessienne factorisée de Kronecker

Donghyun Lee, Yuhang Li, Ruokai Yin, et al.

Distillation de politique par région de confiance

Apprentissage Par Renforcement

Entraînement Du Modèle

Zhengpeng Xie, Li Lyna Zhang, Zeke Xie, et al.

Les modèles de génération vidéo sont des apprenants visuels généralistes

Texte Vers Vidéo

Modèle De Diffusion

Letian Wang, Chuhan Zhang, Rishabh Kabra, et al.

Pré-entraînement visuel évolutif pour l'intelligence linguistique

Yiming Zhang, Zhonghan Zhao, Wenwei Zhang, et al.

Long-Horizon-Terminal-Bench : tester les limites des agents sur des tâches terminales à long horizon avec une évaluation dense basée sur les récompenses

Zongxia Li, Zhongzhi Li, Yucheng Shi, et al.

LLM-comme-tuteur : Adaptation des invites consciente de la politique pour l'apprentissage par renforcement non vérifiable

Apprentissage Par Renforcement

Yujin Kim, Namgyu Ho, Sangmin Hwang, et al.

Graphe de Tâches Atomiques : Un Cadre Unifié pour la Planification et l'Exécution Agentiques

Yue Zhang, Sihan Chen, Ziwen Huang, et al.

LongE2V : Reconstruction, prédiction et interpolation d'images vidéo à long horizon basées sur les événements avec des modèles de diffusion vidéo

Modèle De Diffusion

Génération De Vidéo

Cheng-De Fan, Chun-Wei Tuan Mu, Chen-Wei Chang, et al.

UniClawBench : un banc d’essai universel pour les agents proactifs sur des tâches du monde réel

Zhekai Chen, Chengqi Duan, Kaiyue Sun, et al.

Les idées ont des génomes : évaluation du raisonnement sur les lignées scientifiques et de la génération d'idées fondée sur les lignées

IA Pour La Science

Yifan Zhou, Qihao Yang, Yan Li, et al.

Pourquoi ne puis-je pas ouvrir mon tiroir ? Atténuer les raccourcis orientés objet dans la reconnaissance compositionnelle d'actions en zero-shot

Compréhension Vidéo

Reconnaissance D'action

Geo Ahn, Inwoong Lee, Taeoh Kim, et al.

Video-Oasis : Repenser l'évaluation de la compréhension vidéo

Compréhension Vidéo

Geuntaek Lim, Sungjune Park, Jaeyun Lee, et al.

Vidu S1 : un modèle de génération vidéo interactive en temps réel

Génération De Vidéo

Modèle De Diffusion

Jintao Zhang, Kai Jiang, Jintao Chen, et al.

Mesurer l'écart entre les idées de recherche humaines et celles générées par les LLM

IA Pour La Science

Ziyu Chen, Yilun Zhao, Arman Cohan

L'effet Harness : Comment la conception de l'orchestration définit l'économie des tokens de l'IA agentique d'entreprise

Muayad Sayed Ali, Aliaksandra Novik, Anji Boddupally, et al.

Mondes Infinis aux Interactions Polyvalentes

Génération De Vidéo

Zelin Gao, Qiuyu Wang, Jiapeng Zhu, et al.

Évolution de programmes guidée par LLM pour des attaques ciblées en boîte noire sur les algorithmes de hachage perceptuel

Les LLM sont-ils prêts pour HARDCHOICES ?

Prezta : Exécution distante prouvable d'autorisation Zero-Trust à l'aide de SNARKs

Distillation par scores uniquement pour la recherche dense compacte

FAIR GraphRAG : une approche de génération augmentée par récupération pour l'analyse de données sémantiques

ManiScope : Analyse visuelle assistée par LLM du risque de manipulation des cryptomonnaies

Décodage neuronal événementiel pour le contrôle moteur neuroprothétique

Libérer chaque expert dans l’entraînement spécifique à un domaine

EdgeBench : Dévoiler les lois d'échelle de l'apprentissage à partir d'environnements réels

ARDY : Diffusion autorégressive avec représentation hybride pour la génération interactive de mouvements humains

PithTrain : un système compact et agent-natif pour l’entraînement de modèles MoE

Les modèles de langage ont besoin de sommeil : apprendre à s’auto-modifier et à consolider les souvenirs

HunyuanOCR-1.5 : Rendre les modèles OCR légers de type VLM plus rapides et plus performants

De la génération RVB à la lecture de champs denses : prédiction dense dans l'espace pixel avec des modèles texte-image

KronQ : Quantification des LLM via la Hessienne factorisée de Kronecker

Distillation de politique par région de confiance

Les modèles de génération vidéo sont des apprenants visuels généralistes

Pré-entraînement visuel évolutif pour l'intelligence linguistique

Long-Horizon-Terminal-Bench : tester les limites des agents sur des tâches terminales à long horizon avec une évaluation dense basée sur les récompenses

LLM-comme-tuteur : Adaptation des invites consciente de la politique pour l'apprentissage par renforcement non vérifiable

Graphe de Tâches Atomiques : Un Cadre Unifié pour la Planification et l'Exécution Agentiques

LongE2V : Reconstruction, prédiction et interpolation d'images vidéo à long horizon basées sur les événements avec des modèles de diffusion vidéo

UniClawBench : un banc d’essai universel pour les agents proactifs sur des tâches du monde réel

Les idées ont des génomes : évaluation du raisonnement sur les lignées scientifiques et de la génération d'idées fondée sur les lignées

Pourquoi ne puis-je pas ouvrir mon tiroir ? Atténuer les raccourcis orientés objet dans la reconnaissance compositionnelle d'actions en zero-shot

Video-Oasis : Repenser l'évaluation de la compréhension vidéo

Vidu S1 : un modèle de génération vidéo interactive en temps réel

Mesurer l'écart entre les idées de recherche humaines et celles générées par les LLM

L'effet Harness : Comment la conception de l'orchestration définit l'économie des tokens de l'IA agentique d'entreprise

Mondes Infinis aux Interactions Polyvalentes

Évolution de programmes guidée par LLM pour des attaques ciblées en boîte noire sur les algorithmes de hachage perceptuel

Les LLM sont-ils prêts pour HARDCHOICES ?

Prezta : Exécution distante prouvable d'autorisation Zero-Trust à l'aide de SNARKs

Distillation par scores uniquement pour la recherche dense compacte

FAIR GraphRAG : une approche de génération augmentée par récupération pour l'analyse de données sémantiques

ManiScope : Analyse visuelle assistée par LLM du risque de manipulation des cryptomonnaies

Décodage neuronal événementiel pour le contrôle moteur neuroprothétique

Libérer chaque expert dans l’entraînement spécifique à un domaine

EdgeBench : Dévoiler les lois d'échelle de l'apprentissage à partir d'environnements réels

ARDY : Diffusion autorégressive avec représentation hybride pour la génération interactive de mouvements humains

PithTrain : un système compact et agent-natif pour l’entraînement de modèles MoE

Les modèles de langage ont besoin de sommeil : apprendre à s’auto-modifier et à consolider les souvenirs

HunyuanOCR-1.5 : Rendre les modèles OCR légers de type VLM plus rapides et plus performants

De la génération RVB à la lecture de champs denses : prédiction dense dans l'espace pixel avec des modèles texte-image

KronQ : Quantification des LLM via la Hessienne factorisée de Kronecker

Distillation de politique par région de confiance

Les modèles de génération vidéo sont des apprenants visuels généralistes

Pré-entraînement visuel évolutif pour l'intelligence linguistique

Long-Horizon-Terminal-Bench : tester les limites des agents sur des tâches terminales à long horizon avec une évaluation dense basée sur les récompenses

LLM-comme-tuteur : Adaptation des invites consciente de la politique pour l'apprentissage par renforcement non vérifiable

Graphe de Tâches Atomiques : Un Cadre Unifié pour la Planification et l'Exécution Agentiques

LongE2V : Reconstruction, prédiction et interpolation d'images vidéo à long horizon basées sur les événements avec des modèles de diffusion vidéo

UniClawBench : un banc d’essai universel pour les agents proactifs sur des tâches du monde réel

Les idées ont des génomes : évaluation du raisonnement sur les lignées scientifiques et de la génération d'idées fondée sur les lignées

Pourquoi ne puis-je pas ouvrir mon tiroir ? Atténuer les raccourcis orientés objet dans la reconnaissance compositionnelle d'actions en zero-shot

Video-Oasis : Repenser l'évaluation de la compréhension vidéo

Vidu S1 : un modèle de génération vidéo interactive en temps réel

Mesurer l'écart entre les idées de recherche humaines et celles générées par les LLM

L'effet Harness : Comment la conception de l'orchestration définit l'économie des tokens de l'IA agentique d'entreprise

Mondes Infinis aux Interactions Polyvalentes