HyperAI

Principal

GPU

Console
Studio
Docs
Tarifs

Pulse

Actualités

Ressources

Publications de recherche
Notebooks
Jeux de données
Wiki

Benchmarks

SOTA
Modèles LLM
Classement des GPU

Communauté

Événements

Utilitaires

À propos Conditions d’utilisation Politique de confidentialité
Français

Command Palette

Search for a command to run...

HyperAI
Papers

Papers

Articles de recherche en IA de pointe mis à jour quotidiennement pour vous aider à suivre les dernières tendances en IA

Construire l’avenir de l’intelligence artificielle

À propos

À propos Support Aide relative au jeu de données

Produits

Actualités Publications de recherche Notebooks Jeux de données Wiki

Liens

© HyperAI

GitHub Discord X (formerly Twitter)

HyperAI

Principal

GPU

Console
Studio
Docs
Tarifs

Pulse

Actualités

Ressources

Publications de recherche
Notebooks
Jeux de données
Wiki

Benchmarks

SOTA
Modèles LLM
Classement des GPU

Communauté

Événements

Utilitaires

À propos Conditions d’utilisation Politique de confidentialité
Français

Command Palette

Search for a command to run...

HyperAI
Papers

Papers

Articles de recherche en IA de pointe mis à jour quotidiennement pour vous aider à suivre les dernières tendances en IA

Construire l’avenir de l’intelligence artificielle

À propos

À propos Support Aide relative au jeu de données

Produits

Actualités Publications de recherche Notebooks Jeux de données Wiki

Liens

© HyperAI

GitHub Discord X (formerly Twitter)

MAI-Thinking-1 : Concevoir une machine de type Hill-Climbing

MAI-Thinking-1 : Concevoir une machine de type Hill-Climbing

Entraînement Du Modèle

$VLM^3$ : Les modèles de langage visuels sont des apprenants natifs en 3D

$VLM^3$ : Les modèles de langage visuels sont des apprenants natifs en 3D

Génération 3D

Estimation De Profondeur

Zhipeng Cai, Zhuang Liu, Yunyang Xiong, et al.

Harness-1 : Apprentissage par renforcement pour les agents de recherche avec des harnais externalisant l’état

Génération Augmentée Par La Recherche

Pengcheng Jiang, Zhiyi Shi, Kelly Hong, et al.

DeepCrack : Une architecture d’apprentissage hiérarchique de caractéristiques profondes pour la segmentation des fissures

Segmentation Sémantique

Segmentation D'images

Yahui Liu, Lian Yao, Xiaohu Lu, et al.

VideoMLA : Cache KV latent de bas rang pour la diffusion vidéo autoregressive à l'échelle de la minute

Génération De Vidéo

Modèle De Diffusion

Hidir Yesiltepe, Jiazhen Hu, Tuna Han Salih Meral, et al.

Draft-OPD : Distillation sur politique pour modèles de brouillon spéculatifs

Génération De Texte

Haodi Lei, Yafy Li, Haoran Zhang, et al.

K-BrowseComp : Un benchmark d'Agent de navigation web ancré dans des contextes coréens

Nahyun Lee, Dongkeun Yoon, Guijin Son, et al.

Une question de TASTE : Améliorer la couverture et la difficulté des Agent Benchmarks

Tomer Keren, Nitay Calderon, Asaf Yehudai, et al.

Sur le passage à l'échelle de PEFT : Vers des modèles personnels de millions de paramètres de mille milliards de paramètres

Entraînement Du Modèle

Mind Lab, Song Cao, Vic Cao, et al.

Crafter : Un Cadre Multi-Agent pour la Génération de Figures Scientifiques Modifiables à partir de Diverses Entrées

Génération D'images

IA Pour La Science

Haozhe Zhao, Shuzheng Si, Zhenhailong Wang, et al.

TACK : Évaluation statistique de l'activité de dégradation sur un nouvel ensemble de connaissances TArgeting Chimeras

IA Pour La Science

Apprentissage Profond

Stefano Ribes, Nils Dunlop, Rocío Mercado

Narrative Weaver : Vers une cohérence visuelle à longue portée contrôlable grâce à un conditionnement multimodal

Génération De Vidéo

Zhengjian Yao, Yongzhi Li, Xinyuan Gao, et al.

Le mise à jour du harnais n'est pas un bénéfice du harnais : dissocier les capacités d'évolution dans les Agents LLM auto-évoluants

Minhua Lin, Juncheng Wu, Zijun Wang, et al.

LongTraceRL : Apprentissage du raisonnement sur de longs contextes à partir de trajectoires d'Agents de recherche avec des récompenses par grille

Apprentissage Par Renforcement

Nianyi Lin, Jiajie Zhang, Lei Hou, et al.

Mélange de comportements de région de confiance pour la distillation sur politique

Apprentissage Par Renforcement

Daniil Plyusov, Alexey Gorbatovski, Alexey Malakhov, et al.

SwanVoice : Synthèse vocale expressive zéro-shot de longue durée pour le monologue et le dialogue

Ruiqi Li, Yu Zhang, Changhao Pan, et al.

Forçage de Représentation pour des modèles multimodaux unifiés sans goulot d'étranglement

Génération D'images

Yuqing Wang, Zhijie Lin, Ceyuan Yang, et al.

GrepSeek : Entraînement d'Agents de recherche pour une interaction directe avec le corpus

Alireza Salemi, Chang Zeng, Atharva Nijasure, et al.

COLLEAGUE.SKILL : Génération automatisée de compétences d'IA via la distillation des connaissances d'expert

Tianyi Zhou, Dongrui Liu, Leitao Yuan, et al.

Les systèmes agissants comme moyen d’amélioration des modèles de raisonnement faibles

Varun Sunkaraneni, Pierfrancesco Beneventano, Riccardo Neumarker, et al.

YoCausal : À quelle distance la génération de vidéos se trouve-t-elle du modèle du monde ? Une perspective causale

Génération De Vidéo

Modèle De Diffusion

You-Zhe Xie, Yu-Hsuan Li, Jie-Ying Lee, et al.

minWM : Un framework full-stack open-source pour des modèles du monde vidéo interactifs en temps réel

Génération De Vidéo

Modèle De Diffusion

Min Zhao, Hongzhou Zhu, Bokai Yan, et al.

CollectionLoRA : Collecter 50 effets dans 1 LoRA via la distillation on-policy multi-enseignant

Modèle De Diffusion

Génération D'images

Fangtai Wu, Hailong Guo, Shijie Huang, et al.

OmniRetrieval : Récupération unifiée à travers des sources de connaissances hétérogènes

Génération Augmentée Par La Recherche

Réponse Aux Questions Intelligente

Jinheon Baek, Soyeong Jeong, Sangwoo Park, et al.

Qwen-VLA : Unification de la modélisation vision-langage-action à travers les tâches, les environnements et les incarnations robotiques

Qiuyue Wang, Mingsheng Li, Jian Guan, et al.

AgentDoG 1.5 : Un cadre d'alignement léger et évolutif pour la sécurité et la sûreté des Agent IA

Dongrui Liu, Yu Li, Zhonghao Yang, et al.

Modèles d'action mondiaux : La prochaine frontière en IA incarnée

Intelligence Incarnée

Siyin Wang, Junhao Shi, Zhaoyang Fu, et al.

Les modèles d'action mondiaux sont des politiques zéro-shot

Modèle De Diffusion

Génération De Vidéo

Seonghyeon Ye, Yunhao Ge, Kaiyuan Zheng, et al.

ResearchMath-14K : Mise à l'échelle des mathématiques de niveau recherche via Agents

Guijin Son, Seungyeop Yi, Minju Gwak, et al.

Modèles de Langage Auto-Améliorants avec Recherche Évolutionnaire Bidirectionnelle

Entraînement Du Modèle

Guowei Xu, Zhenting Qi, Huangyuan Su, et al.

Des Pixels aux Mots -- Vers des Modèles Natifs One-Vision à Grande Échelle

Compréhension Vidéo

Haiwen Diao, Jiahao Wang, Penghao Wu, et al.

Optimisation de la politique exploratoire d'Agent pour le raisonnement agentique multimodal

Minki Kang, Shizhe Diao, Ryo Hachiuma, et al.

MAI-Thinking-1 : Concevoir une machine de type Hill-Climbing

MAI-Thinking-1 : Concevoir une machine de type Hill-Climbing

Entraînement Du Modèle

$VLM^3$ : Les modèles de langage visuels sont des apprenants natifs en 3D

$VLM^3$ : Les modèles de langage visuels sont des apprenants natifs en 3D

Génération 3D

Estimation De Profondeur

Zhipeng Cai, Zhuang Liu, Yunyang Xiong, et al.

Harness-1 : Apprentissage par renforcement pour les agents de recherche avec des harnais externalisant l’état

Génération Augmentée Par La Recherche

Pengcheng Jiang, Zhiyi Shi, Kelly Hong, et al.

DeepCrack : Une architecture d’apprentissage hiérarchique de caractéristiques profondes pour la segmentation des fissures

Segmentation Sémantique

Segmentation D'images

Yahui Liu, Lian Yao, Xiaohu Lu, et al.

VideoMLA : Cache KV latent de bas rang pour la diffusion vidéo autoregressive à l'échelle de la minute

Génération De Vidéo

Modèle De Diffusion

Hidir Yesiltepe, Jiazhen Hu, Tuna Han Salih Meral, et al.

Draft-OPD : Distillation sur politique pour modèles de brouillon spéculatifs

Génération De Texte

Haodi Lei, Yafy Li, Haoran Zhang, et al.

K-BrowseComp : Un benchmark d'Agent de navigation web ancré dans des contextes coréens

Nahyun Lee, Dongkeun Yoon, Guijin Son, et al.

Une question de TASTE : Améliorer la couverture et la difficulté des Agent Benchmarks

Tomer Keren, Nitay Calderon, Asaf Yehudai, et al.

Sur le passage à l'échelle de PEFT : Vers des modèles personnels de millions de paramètres de mille milliards de paramètres

Entraînement Du Modèle

Mind Lab, Song Cao, Vic Cao, et al.

Crafter : Un Cadre Multi-Agent pour la Génération de Figures Scientifiques Modifiables à partir de Diverses Entrées

Génération D'images

IA Pour La Science

Haozhe Zhao, Shuzheng Si, Zhenhailong Wang, et al.

TACK : Évaluation statistique de l'activité de dégradation sur un nouvel ensemble de connaissances TArgeting Chimeras

IA Pour La Science

Apprentissage Profond

Stefano Ribes, Nils Dunlop, Rocío Mercado

Narrative Weaver : Vers une cohérence visuelle à longue portée contrôlable grâce à un conditionnement multimodal

Génération De Vidéo

Zhengjian Yao, Yongzhi Li, Xinyuan Gao, et al.

Le mise à jour du harnais n'est pas un bénéfice du harnais : dissocier les capacités d'évolution dans les Agents LLM auto-évoluants

Minhua Lin, Juncheng Wu, Zijun Wang, et al.

LongTraceRL : Apprentissage du raisonnement sur de longs contextes à partir de trajectoires d'Agents de recherche avec des récompenses par grille

Apprentissage Par Renforcement

Nianyi Lin, Jiajie Zhang, Lei Hou, et al.

Mélange de comportements de région de confiance pour la distillation sur politique

Apprentissage Par Renforcement

Daniil Plyusov, Alexey Gorbatovski, Alexey Malakhov, et al.

SwanVoice : Synthèse vocale expressive zéro-shot de longue durée pour le monologue et le dialogue

Ruiqi Li, Yu Zhang, Changhao Pan, et al.

Forçage de Représentation pour des modèles multimodaux unifiés sans goulot d'étranglement

Génération D'images

Yuqing Wang, Zhijie Lin, Ceyuan Yang, et al.

GrepSeek : Entraînement d'Agents de recherche pour une interaction directe avec le corpus

Alireza Salemi, Chang Zeng, Atharva Nijasure, et al.

COLLEAGUE.SKILL : Génération automatisée de compétences d'IA via la distillation des connaissances d'expert

Tianyi Zhou, Dongrui Liu, Leitao Yuan, et al.

Les systèmes agissants comme moyen d’amélioration des modèles de raisonnement faibles

Varun Sunkaraneni, Pierfrancesco Beneventano, Riccardo Neumarker, et al.

YoCausal : À quelle distance la génération de vidéos se trouve-t-elle du modèle du monde ? Une perspective causale

Génération De Vidéo

Modèle De Diffusion

You-Zhe Xie, Yu-Hsuan Li, Jie-Ying Lee, et al.

minWM : Un framework full-stack open-source pour des modèles du monde vidéo interactifs en temps réel

Génération De Vidéo

Modèle De Diffusion

Min Zhao, Hongzhou Zhu, Bokai Yan, et al.

CollectionLoRA : Collecter 50 effets dans 1 LoRA via la distillation on-policy multi-enseignant

Modèle De Diffusion

Génération D'images

Fangtai Wu, Hailong Guo, Shijie Huang, et al.

OmniRetrieval : Récupération unifiée à travers des sources de connaissances hétérogènes

Génération Augmentée Par La Recherche

Réponse Aux Questions Intelligente

Jinheon Baek, Soyeong Jeong, Sangwoo Park, et al.

Qwen-VLA : Unification de la modélisation vision-langage-action à travers les tâches, les environnements et les incarnations robotiques

Qiuyue Wang, Mingsheng Li, Jian Guan, et al.

AgentDoG 1.5 : Un cadre d'alignement léger et évolutif pour la sécurité et la sûreté des Agent IA

Dongrui Liu, Yu Li, Zhonghao Yang, et al.

Modèles d'action mondiaux : La prochaine frontière en IA incarnée

Intelligence Incarnée

Siyin Wang, Junhao Shi, Zhaoyang Fu, et al.

Les modèles d'action mondiaux sont des politiques zéro-shot

Modèle De Diffusion

Génération De Vidéo

Seonghyeon Ye, Yunhao Ge, Kaiyuan Zheng, et al.

ResearchMath-14K : Mise à l'échelle des mathématiques de niveau recherche via Agents

Guijin Son, Seungyeop Yi, Minju Gwak, et al.

Modèles de Langage Auto-Améliorants avec Recherche Évolutionnaire Bidirectionnelle

Entraînement Du Modèle

Guowei Xu, Zhenting Qi, Huangyuan Su, et al.

Des Pixels aux Mots -- Vers des Modèles Natifs One-Vision à Grande Échelle

Compréhension Vidéo

Haiwen Diao, Jiahao Wang, Penghao Wu, et al.

Optimisation de la politique exploratoire d'Agent pour le raisonnement agentique multimodal

Minki Kang, Shizhe Diao, Ryo Hachiuma, et al.

Harness-1 : Apprentissage par renforcement pour les agents de recherche avec des harnais externalisant l’état

DeepCrack : Une architecture d’apprentissage hiérarchique de caractéristiques profondes pour la segmentation des fissures

VideoMLA : Cache KV latent de bas rang pour la diffusion vidéo autoregressive à l'échelle de la minute

Draft-OPD : Distillation sur politique pour modèles de brouillon spéculatifs

K-BrowseComp : Un benchmark d'Agent de navigation web ancré dans des contextes coréens

Une question de TASTE : Améliorer la couverture et la difficulté des Agent Benchmarks

Sur le passage à l'échelle de PEFT : Vers des modèles personnels de millions de paramètres de mille milliards de paramètres

Crafter : Un Cadre Multi-Agent pour la Génération de Figures Scientifiques Modifiables à partir de Diverses Entrées

TACK : Évaluation statistique de l'activité de dégradation sur un nouvel ensemble de connaissances TArgeting Chimeras

Narrative Weaver : Vers une cohérence visuelle à longue portée contrôlable grâce à un conditionnement multimodal

Le mise à jour du harnais n'est pas un bénéfice du harnais : dissocier les capacités d'évolution dans les Agents LLM auto-évoluants

LongTraceRL : Apprentissage du raisonnement sur de longs contextes à partir de trajectoires d'Agents de recherche avec des récompenses par grille

Mélange de comportements de région de confiance pour la distillation sur politique

SwanVoice : Synthèse vocale expressive zéro-shot de longue durée pour le monologue et le dialogue

Forçage de Représentation pour des modèles multimodaux unifiés sans goulot d'étranglement

GrepSeek : Entraînement d'Agents de recherche pour une interaction directe avec le corpus

COLLEAGUE.SKILL : Génération automatisée de compétences d'IA via la distillation des connaissances d'expert

Les systèmes agissants comme moyen d’amélioration des modèles de raisonnement faibles

YoCausal : À quelle distance la génération de vidéos se trouve-t-elle du modèle du monde ? Une perspective causale

minWM : Un framework full-stack open-source pour des modèles du monde vidéo interactifs en temps réel

CollectionLoRA : Collecter 50 effets dans 1 LoRA via la distillation on-policy multi-enseignant

OmniRetrieval : Récupération unifiée à travers des sources de connaissances hétérogènes

Qwen-VLA : Unification de la modélisation vision-langage-action à travers les tâches, les environnements et les incarnations robotiques

AgentDoG 1.5 : Un cadre d'alignement léger et évolutif pour la sécurité et la sûreté des Agent IA

Modèles d'action mondiaux : La prochaine frontière en IA incarnée

Les modèles d'action mondiaux sont des politiques zéro-shot

ResearchMath-14K : Mise à l'échelle des mathématiques de niveau recherche via Agents

Modèles de Langage Auto-Améliorants avec Recherche Évolutionnaire Bidirectionnelle

Des Pixels aux Mots -- Vers des Modèles Natifs One-Vision à Grande Échelle

Optimisation de la politique exploratoire d'Agent pour le raisonnement agentique multimodal

Harness-1 : Apprentissage par renforcement pour les agents de recherche avec des harnais externalisant l’état

DeepCrack : Une architecture d’apprentissage hiérarchique de caractéristiques profondes pour la segmentation des fissures

VideoMLA : Cache KV latent de bas rang pour la diffusion vidéo autoregressive à l'échelle de la minute

Draft-OPD : Distillation sur politique pour modèles de brouillon spéculatifs

K-BrowseComp : Un benchmark d'Agent de navigation web ancré dans des contextes coréens

Une question de TASTE : Améliorer la couverture et la difficulté des Agent Benchmarks

Sur le passage à l'échelle de PEFT : Vers des modèles personnels de millions de paramètres de mille milliards de paramètres

Crafter : Un Cadre Multi-Agent pour la Génération de Figures Scientifiques Modifiables à partir de Diverses Entrées

TACK : Évaluation statistique de l'activité de dégradation sur un nouvel ensemble de connaissances TArgeting Chimeras

Narrative Weaver : Vers une cohérence visuelle à longue portée contrôlable grâce à un conditionnement multimodal

Le mise à jour du harnais n'est pas un bénéfice du harnais : dissocier les capacités d'évolution dans les Agents LLM auto-évoluants

LongTraceRL : Apprentissage du raisonnement sur de longs contextes à partir de trajectoires d'Agents de recherche avec des récompenses par grille

Mélange de comportements de région de confiance pour la distillation sur politique

SwanVoice : Synthèse vocale expressive zéro-shot de longue durée pour le monologue et le dialogue

Forçage de Représentation pour des modèles multimodaux unifiés sans goulot d'étranglement

GrepSeek : Entraînement d'Agents de recherche pour une interaction directe avec le corpus

COLLEAGUE.SKILL : Génération automatisée de compétences d'IA via la distillation des connaissances d'expert

Les systèmes agissants comme moyen d’amélioration des modèles de raisonnement faibles

YoCausal : À quelle distance la génération de vidéos se trouve-t-elle du modèle du monde ? Une perspective causale

minWM : Un framework full-stack open-source pour des modèles du monde vidéo interactifs en temps réel

CollectionLoRA : Collecter 50 effets dans 1 LoRA via la distillation on-policy multi-enseignant

OmniRetrieval : Récupération unifiée à travers des sources de connaissances hétérogènes

Qwen-VLA : Unification de la modélisation vision-langage-action à travers les tâches, les environnements et les incarnations robotiques

AgentDoG 1.5 : Un cadre d'alignement léger et évolutif pour la sécurité et la sûreté des Agent IA

Modèles d'action mondiaux : La prochaine frontière en IA incarnée

Les modèles d'action mondiaux sont des politiques zéro-shot

ResearchMath-14K : Mise à l'échelle des mathématiques de niveau recherche via Agents

Modèles de Langage Auto-Améliorants avec Recherche Évolutionnaire Bidirectionnelle

Des Pixels aux Mots -- Vers des Modèles Natifs One-Vision à Grande Échelle

Optimisation de la politique exploratoire d'Agent pour le raisonnement agentique multimodal