HyperAI

Principal

GPU

Console
Studio
Docs
Tarifs

Pulse

Actualités

Ressources

Publications de recherche
Notebooks
Jeux de données
Wiki

Benchmarks

SOTA
Modèles LLM
Classement des GPU

Communauté

Événements

Utilitaires

À propos Conditions d’utilisation Politique de confidentialité
Français

Command Palette

Search for a command to run...

HyperAI
Papers

Papers

Articles de recherche en IA de pointe mis à jour quotidiennement pour vous aider à suivre les dernières tendances en IA

Construire l’avenir de l’intelligence artificielle

À propos

À propos Support Aide relative au jeu de données

Produits

Actualités Publications de recherche Notebooks Jeux de données Wiki

Liens

© HyperAI

GitHub Discord X (formerly Twitter)

HyperAI

Principal

GPU

Console
Studio
Docs
Tarifs

Pulse

Actualités

Ressources

Publications de recherche
Notebooks
Jeux de données
Wiki

Benchmarks

SOTA
Modèles LLM
Classement des GPU

Communauté

Événements

Utilitaires

À propos Conditions d’utilisation Politique de confidentialité
Français

Command Palette

Search for a command to run...

HyperAI
Papers

Papers

Articles de recherche en IA de pointe mis à jour quotidiennement pour vous aider à suivre les dernières tendances en IA

Construire l’avenir de l’intelligence artificielle

À propos

À propos Support Aide relative au jeu de données

Produits

Actualités Publications de recherche Notebooks Jeux de données Wiki

Liens

© HyperAI

GitHub Discord X (formerly Twitter)

MemDreamer : Découplage de la perception et du raisonnement pour la compréhension de vidéos longues via une mémoire de graphes hiérarchique et un mécanisme de recherche Agentic

MemDreamer : Découplage de la perception et du raisonnement pour la compréhension de vidéos longues via une mémoire de graphes hiérarchique et un mécanisme de recherche Agentic

Compréhension Vidéo

Cong Chen, Guo Gan, Kaixiang Ji, et al.

SearchSwarm : Vers l'Intelligence de Délégation dans les LLMs agents pour la Recherche Approfondie à Long Terme

SearchSwarm : Vers l'Intelligence de Délégation dans les LLMs agents pour la Recherche Approfondie à Long Terme

Pu Ning, Quan Chen, Kun Tao, et al.

Optimisation rétrospective du contrôle : Amélioration des Agents LLM via l'auto-préférence sur les déroulés de trajectoire

Wenbo Pan, Shujie Liu, Chin-Yew Lin, et al.

Rôle-Agent : Amorçage des Agents LLM via une Évolution à double rôle

Xucong Wang, Ziyu Ma, Shidong Yang, et al.

ABot-Earth 0.5 : Modèle 3D Génératif de la Terre

Génération 3D

Ming Qian, Tianjian Ouyang, Mingchao Sun, et al.

Rapport Technique Kwai Keye-VL-2.0

Compréhension Vidéo

Kwai Keye Team, Bin Wen, Changyi Liu, et al.

TESSERA : Embeddings temporels des spectres de surface pour la représentation et l'analyse de la Terre

Représentation Multimodale

Apprentissage Profond

Zhengpeng Feng, Clement Atzberger, Sadiq Jaffer, et al.

Si les LLMs possèdent des attributs proches de ceux des humains, Age of Empires II en possède également.

Adrian de Wynter

Le dernier article écrit par des humains : artefacts de recherche natifs aux agents

IA Pour La Science

Jiachen Liu, Jiaxin Pei, Jintao Huang, et al.

FlashMemory-DeepSeek-V4 : Index Éclair Contexte Ultra-Long via Attention Éparse par Anticipation

Yan Wang, Qifan Zhang, Jiachen Yu, et al.

LatentSkill : De compétences textuelles en contexte à des compétences latentes dans les poids pour les Agents LLM

Aofan Yu, Chenyu Zhou, Tianyi Xu, et al.

CoVEBench : Les modèles de montage vidéo peuvent-ils gérer des instructions complexes ?

Texte Vers Vidéo

Génération De Vidéo

Jiangtao Wu, Jiaming Wang, Yiwen He, et al.

Mémoire spatiale latente pour modèles du monde vidéo

Génération De Vidéo

Modèle De Diffusion

Weijie Wang, Haoyu Zhao, Yifan Yang, et al.

Sur la géométrie de la distillation on-policy

Entraînement Du Modèle

Zhennan Shen, Yanshu Li, Qingyu Yin, et al.

SWE-Explore : Évaluation de la manière dont les Agents de codage explorent les dépôts

Génération De Code

Shaoqiu Zhang, Yuhang Wang, Jialiang Liang, et al.

Rapport technique sur VoxCPM2

Modèle De Diffusion

Génération De Vidéo

Meituan LongCat Team

ChartNet : Un jeu de données multimodal de haute qualité et d'échelle millier pour la compréhension robuste des graphiques

Réponse À Des Questions Visuelles

Jovana Kondic, Pengyuan Li, Dhiraj Joshi, et al.

ACL-Verbatim: Questionnement sans hallucinations pour la recherche

Génération Augmentée Par La Recherche

Réponse Aux Questions Intelligente

Gábor Recski, Szilveszter Tóth, Nadia Verdha, et al.

Au-delà des dialogues statiques : évaluer la mémoire à long terme réaliste, hétérogène et évolutive

Han Zhang, Zihao Tang, Xin Yu, et al.

La fin de l'ingénierie logicielle : Comment les Agents IA restructurent fondamentalement le paradigme logiciel

Pourquoi les modèles plus grands apprennent davantage : Effets de la capacité, de l’interférence et de la rétention des tâches rares

Apprentissage Profond

Apprentissage Multi-tâches

Jing Huang, Daniel Wurgaft, Rachit Bansal, et al.

Quand les outils échouent : Évaluation de la replanification dynamique et de la récupération d'anomalies dans les Agents LLM

Dongsheng Zhu, Xuchen Ma, Yucheng Shen, et al.

Insertion directe d'objets consciente de la 3D via des proxies visuels décomposés

Modèle De Diffusion

Génération D'images

Jingbo Gong, Yikai Wang, Yushi Lan, et al.

AnchorWorld : Simulation de monde incarnée et égocentrique avec personnalisation de l'évolution basée sur la vue

Intelligence Incarnée

Génération 3D

Yu Li, Menghan Xia, Gongye Liu, et al.

SoCRATES : Vers une évaluation automatisée et fiable de la médiation proactive par LLM à travers les domaines et les variations socio-cognitives

Taewon Yun, Hyeonseong Park, Jeonghwan Choi, et al.

MMAE : Un benchmark massif multitâche d'édition audio

Traitement Audio Et Vocal

Ziyang Ma, Ruiqi Yan, Ruiyang Xu, et al.

Votre matrice d'UnEmbedding est secrètement une lentille de fonctionnalités pour les embeddings de texte

Songhao Wu, Zhongxin Chen, Yuxuan Liu, et al.

ChordEdit : Transport en une seule étape à faible consommation énergétique pour l’édition d’images

Modèle De Diffusion

Texte Vers Image

Liangsi Lu, Xuhang Chen, Minzhe Guo, et al.

NitroGen : Un modèle de base ouvert pour les agents de jeu généralistes

Loïc Magne, Anas Awadalla, Guanzhi Wang, et al.

Reconstruction efficace de scènes dynamiques, une D4RT à la fois

Estimation De Profondeur

Vision Machine 3D

Chuhan Zhang, Guillaume Le Moing, Skanda Koppula, et al.

Continual Learning Bench : Évaluation des systèmes d'IA de pointe dans des environnements réels avec état

Parth Asawa, Christopher M. Glaze, Gabriel Orlanski, et al.

MemDreamer : Découplage de la perception et du raisonnement pour la compréhension de vidéos longues via une mémoire de graphes hiérarchique et un mécanisme de recherche Agentic

MemDreamer : Découplage de la perception et du raisonnement pour la compréhension de vidéos longues via une mémoire de graphes hiérarchique et un mécanisme de recherche Agentic

Compréhension Vidéo

Cong Chen, Guo Gan, Kaixiang Ji, et al.

SearchSwarm : Vers l'Intelligence de Délégation dans les LLMs agents pour la Recherche Approfondie à Long Terme

SearchSwarm : Vers l'Intelligence de Délégation dans les LLMs agents pour la Recherche Approfondie à Long Terme

Pu Ning, Quan Chen, Kun Tao, et al.

Optimisation rétrospective du contrôle : Amélioration des Agents LLM via l'auto-préférence sur les déroulés de trajectoire

Wenbo Pan, Shujie Liu, Chin-Yew Lin, et al.

Rôle-Agent : Amorçage des Agents LLM via une Évolution à double rôle

Xucong Wang, Ziyu Ma, Shidong Yang, et al.

ABot-Earth 0.5 : Modèle 3D Génératif de la Terre

Génération 3D

Ming Qian, Tianjian Ouyang, Mingchao Sun, et al.

Rapport Technique Kwai Keye-VL-2.0

Compréhension Vidéo

Kwai Keye Team, Bin Wen, Changyi Liu, et al.

TESSERA : Embeddings temporels des spectres de surface pour la représentation et l'analyse de la Terre

Représentation Multimodale

Apprentissage Profond

Zhengpeng Feng, Clement Atzberger, Sadiq Jaffer, et al.

Si les LLMs possèdent des attributs proches de ceux des humains, Age of Empires II en possède également.

Adrian de Wynter

Le dernier article écrit par des humains : artefacts de recherche natifs aux agents

IA Pour La Science

Jiachen Liu, Jiaxin Pei, Jintao Huang, et al.

FlashMemory-DeepSeek-V4 : Index Éclair Contexte Ultra-Long via Attention Éparse par Anticipation

Yan Wang, Qifan Zhang, Jiachen Yu, et al.

LatentSkill : De compétences textuelles en contexte à des compétences latentes dans les poids pour les Agents LLM

Aofan Yu, Chenyu Zhou, Tianyi Xu, et al.

CoVEBench : Les modèles de montage vidéo peuvent-ils gérer des instructions complexes ?

Texte Vers Vidéo

Génération De Vidéo

Jiangtao Wu, Jiaming Wang, Yiwen He, et al.

Mémoire spatiale latente pour modèles du monde vidéo

Génération De Vidéo

Modèle De Diffusion

Weijie Wang, Haoyu Zhao, Yifan Yang, et al.

Sur la géométrie de la distillation on-policy

Entraînement Du Modèle

Zhennan Shen, Yanshu Li, Qingyu Yin, et al.

SWE-Explore : Évaluation de la manière dont les Agents de codage explorent les dépôts

Génération De Code

Shaoqiu Zhang, Yuhang Wang, Jialiang Liang, et al.

Rapport technique sur VoxCPM2

Modèle De Diffusion

Génération De Vidéo

Meituan LongCat Team

ChartNet : Un jeu de données multimodal de haute qualité et d'échelle millier pour la compréhension robuste des graphiques

Réponse À Des Questions Visuelles

Jovana Kondic, Pengyuan Li, Dhiraj Joshi, et al.

ACL-Verbatim: Questionnement sans hallucinations pour la recherche

Génération Augmentée Par La Recherche

Réponse Aux Questions Intelligente

Gábor Recski, Szilveszter Tóth, Nadia Verdha, et al.

Au-delà des dialogues statiques : évaluer la mémoire à long terme réaliste, hétérogène et évolutive

Han Zhang, Zihao Tang, Xin Yu, et al.

La fin de l'ingénierie logicielle : Comment les Agents IA restructurent fondamentalement le paradigme logiciel

Pourquoi les modèles plus grands apprennent davantage : Effets de la capacité, de l’interférence et de la rétention des tâches rares

Apprentissage Profond

Apprentissage Multi-tâches

Jing Huang, Daniel Wurgaft, Rachit Bansal, et al.

Quand les outils échouent : Évaluation de la replanification dynamique et de la récupération d'anomalies dans les Agents LLM

Dongsheng Zhu, Xuchen Ma, Yucheng Shen, et al.

Insertion directe d'objets consciente de la 3D via des proxies visuels décomposés

Modèle De Diffusion

Génération D'images

Jingbo Gong, Yikai Wang, Yushi Lan, et al.

AnchorWorld : Simulation de monde incarnée et égocentrique avec personnalisation de l'évolution basée sur la vue

Intelligence Incarnée

Génération 3D

Yu Li, Menghan Xia, Gongye Liu, et al.

SoCRATES : Vers une évaluation automatisée et fiable de la médiation proactive par LLM à travers les domaines et les variations socio-cognitives

Taewon Yun, Hyeonseong Park, Jeonghwan Choi, et al.

MMAE : Un benchmark massif multitâche d'édition audio

Traitement Audio Et Vocal

Ziyang Ma, Ruiqi Yan, Ruiyang Xu, et al.

Votre matrice d'UnEmbedding est secrètement une lentille de fonctionnalités pour les embeddings de texte

Songhao Wu, Zhongxin Chen, Yuxuan Liu, et al.

ChordEdit : Transport en une seule étape à faible consommation énergétique pour l’édition d’images

Modèle De Diffusion

Texte Vers Image

Liangsi Lu, Xuhang Chen, Minzhe Guo, et al.

NitroGen : Un modèle de base ouvert pour les agents de jeu généralistes

Loïc Magne, Anas Awadalla, Guanzhi Wang, et al.

Reconstruction efficace de scènes dynamiques, une D4RT à la fois

Estimation De Profondeur

Vision Machine 3D

Chuhan Zhang, Guillaume Le Moing, Skanda Koppula, et al.

Continual Learning Bench : Évaluation des systèmes d'IA de pointe dans des environnements réels avec état

Parth Asawa, Christopher M. Glaze, Gabriel Orlanski, et al.

Optimisation rétrospective du contrôle : Amélioration des Agents LLM via l'auto-préférence sur les déroulés de trajectoire

Rôle-Agent : Amorçage des Agents LLM via une Évolution à double rôle

ABot-Earth 0.5 : Modèle 3D Génératif de la Terre

Rapport Technique Kwai Keye-VL-2.0

TESSERA : Embeddings temporels des spectres de surface pour la représentation et l'analyse de la Terre

Si les LLMs possèdent des attributs proches de ceux des humains, Age of Empires II en possède également.

Le dernier article écrit par des humains : artefacts de recherche natifs aux agents

FlashMemory-DeepSeek-V4 : Index Éclair Contexte Ultra-Long via Attention Éparse par Anticipation

LatentSkill : De compétences textuelles en contexte à des compétences latentes dans les poids pour les Agents LLM

CoVEBench : Les modèles de montage vidéo peuvent-ils gérer des instructions complexes ?

Mémoire spatiale latente pour modèles du monde vidéo

Sur la géométrie de la distillation on-policy

SWE-Explore : Évaluation de la manière dont les Agents de codage explorent les dépôts

Rapport technique sur VoxCPM2

Rapport technique sur LongCat-Video-Avatar 1.5

ChartNet : Un jeu de données multimodal de haute qualité et d'échelle millier pour la compréhension robuste des graphiques

ACL-Verbatim: Questionnement sans hallucinations pour la recherche

Au-delà des dialogues statiques : évaluer la mémoire à long terme réaliste, hétérogène et évolutive

La fin de l'ingénierie logicielle : Comment les Agents IA restructurent fondamentalement le paradigme logiciel

Pourquoi les modèles plus grands apprennent davantage : Effets de la capacité, de l’interférence et de la rétention des tâches rares

Quand les outils échouent : Évaluation de la replanification dynamique et de la récupération d'anomalies dans les Agents LLM

Insertion directe d'objets consciente de la 3D via des proxies visuels décomposés

AnchorWorld : Simulation de monde incarnée et égocentrique avec personnalisation de l'évolution basée sur la vue

SoCRATES : Vers une évaluation automatisée et fiable de la médiation proactive par LLM à travers les domaines et les variations socio-cognitives

MMAE : Un benchmark massif multitâche d'édition audio

Votre matrice d'UnEmbedding est secrètement une lentille de fonctionnalités pour les embeddings de texte

ChordEdit : Transport en une seule étape à faible consommation énergétique pour l’édition d’images

NitroGen : Un modèle de base ouvert pour les agents de jeu généralistes

Reconstruction efficace de scènes dynamiques, une D4RT à la fois

Continual Learning Bench : Évaluation des systèmes d'IA de pointe dans des environnements réels avec état

Optimisation rétrospective du contrôle : Amélioration des Agents LLM via l'auto-préférence sur les déroulés de trajectoire

Rôle-Agent : Amorçage des Agents LLM via une Évolution à double rôle

ABot-Earth 0.5 : Modèle 3D Génératif de la Terre

Rapport Technique Kwai Keye-VL-2.0

TESSERA : Embeddings temporels des spectres de surface pour la représentation et l'analyse de la Terre

Si les LLMs possèdent des attributs proches de ceux des humains, Age of Empires II en possède également.

Le dernier article écrit par des humains : artefacts de recherche natifs aux agents

FlashMemory-DeepSeek-V4 : Index Éclair Contexte Ultra-Long via Attention Éparse par Anticipation

LatentSkill : De compétences textuelles en contexte à des compétences latentes dans les poids pour les Agents LLM

CoVEBench : Les modèles de montage vidéo peuvent-ils gérer des instructions complexes ?

Mémoire spatiale latente pour modèles du monde vidéo

Sur la géométrie de la distillation on-policy

SWE-Explore : Évaluation de la manière dont les Agents de codage explorent les dépôts

Rapport technique sur VoxCPM2

Rapport technique sur LongCat-Video-Avatar 1.5

ChartNet : Un jeu de données multimodal de haute qualité et d'échelle millier pour la compréhension robuste des graphiques

ACL-Verbatim: Questionnement sans hallucinations pour la recherche

Au-delà des dialogues statiques : évaluer la mémoire à long terme réaliste, hétérogène et évolutive

La fin de l'ingénierie logicielle : Comment les Agents IA restructurent fondamentalement le paradigme logiciel

Pourquoi les modèles plus grands apprennent davantage : Effets de la capacité, de l’interférence et de la rétention des tâches rares

Quand les outils échouent : Évaluation de la replanification dynamique et de la récupération d'anomalies dans les Agents LLM

Insertion directe d'objets consciente de la 3D via des proxies visuels décomposés

AnchorWorld : Simulation de monde incarnée et égocentrique avec personnalisation de l'évolution basée sur la vue

SoCRATES : Vers une évaluation automatisée et fiable de la médiation proactive par LLM à travers les domaines et les variations socio-cognitives

MMAE : Un benchmark massif multitâche d'édition audio

Votre matrice d'UnEmbedding est secrètement une lentille de fonctionnalités pour les embeddings de texte

ChordEdit : Transport en une seule étape à faible consommation énergétique pour l’édition d’images

NitroGen : Un modèle de base ouvert pour les agents de jeu généralistes

Reconstruction efficace de scènes dynamiques, une D4RT à la fois

Continual Learning Bench : Évaluation des systèmes d'IA de pointe dans des environnements réels avec état