HyperAI

Principal

GPU

Console
Studio
Docs
Tarifs

Pulse

Actualités

Ressources

Publications de recherche
Notebooks
Jeux de données
Wiki

Benchmarks

SOTA
Modèles LLM
Classement des GPU

Communauté

Événements

Utilitaires

À propos Conditions d’utilisation Politique de confidentialité
Français

Command Palette

Search for a command to run...

HyperAI
Papers

Papers

Articles de recherche en IA de pointe mis à jour quotidiennement pour vous aider à suivre les dernières tendances en IA

Construire l’avenir de l’intelligence artificielle

À propos

À propos Support Aide relative au jeu de données

Produits

Actualités Publications de recherche Notebooks Jeux de données Wiki

Liens

© HyperAI

GitHub Discord X (formerly Twitter)

HyperAI

Principal

GPU

Console
Studio
Docs
Tarifs

Pulse

Actualités

Ressources

Publications de recherche
Notebooks
Jeux de données
Wiki

Benchmarks

SOTA
Modèles LLM
Classement des GPU

Communauté

Événements

Utilitaires

À propos Conditions d’utilisation Politique de confidentialité
Français

Command Palette

Search for a command to run...

HyperAI
Papers

Papers

Articles de recherche en IA de pointe mis à jour quotidiennement pour vous aider à suivre les dernières tendances en IA

Construire l’avenir de l’intelligence artificielle

À propos

À propos Support Aide relative au jeu de données

Produits

Actualités Publications de recherche Notebooks Jeux de données Wiki

Liens

© HyperAI

GitHub Discord X (formerly Twitter)

Contrôle prédictif piloté par les données et à déclenchement d'événement, amélioré par l'apprentissage par renforcement profond, pour un bras robotique souple actionné par câbles 3D

Contrôle prédictif piloté par les données et à déclenchement d'événement, amélioré par l'apprentissage par renforcement profond, pour un bras robotique souple actionné par câbles 3D

Apprentissage Par Renforcement

Cheng Ouyang, Moeen Ul Islam, Kaixiang Zhang, et al.

Ungrokking naturel : Contrôle asymétrique des règles qui survivent au pré-entraînement

Ungrokking naturel : Contrôle asymétrique des règles qui survivent au pré-entraînement

Entraînement Du Modèle

Juliana Li, Diya Sreedhar

Tout entier non négatif est la somme d'un nombre triangulaire, d'un nombre pentagonal et d'un nombre heptagonal

Yichuan Cao, Dakai Guo, Ruichen Qiu, et al.

Ingénierie de boucle : Le manuel Anthropic pour concevoir des systèmes qui interrogent vos agents

Peter Steinberger, Boris Cherny, Addy Osmani

Petits LLM : Élagage vs Apprentissage à partir de zéro

Entraînement Du Modèle

Yufeng Xu, Taiming Lu, Kunjun Li, et al.

OpenThoughts-Agent : Recettes de données pour les modèles agents

Entraînement Du Modèle

Negin Raoof, Richard Zhuang, Marianna Nezhurina, et al.

LingxiDiagBench : Un cadre Multi-Agent pour le benchmarking de LLM dans la consultation et le diagnostic psychiatriques en chinois

Shihao Xu, Tiancheng Zhou, Jiatong Ma, et al.

AOHP : Un environnement open source de niveau OS pour Agent, Interaction personnalisée, efficace et sécurisée

Shanhui Zhao, Jiacheng Liu, Guohong Liu, et al.

MemGUI-Agent : Un Agent GUI Mobile de bout en bout à long horizon avec une gestion proactive du contexte

Guangyi Liu, Gao Wu, Congxiao Liu, et al.

MobileForge : Adaptation sans annotation pour les agents GUI mobiles avec une optimisation de politique guidée par les retours hiérarchiques

Guangyi Liu, Pengxiang Zhao, Gao Wu, et al.

NatureBench : Les Agents de codage peuvent-ils égaler le SOTA publié des articles de la famille Nature ?

IA Pour La Science

Yuru Wang, Lejun Cheng, Yuxin Zuo, et al.

Qwen-AgentWorld : Modèles de monde linguistiques pour agents généraux

Yuxin Zuo, Zikai Xiao, Li Sheng, et al.

Repenser les cibles d’entraînement, les architectures et la qualité des données pour l’amélioration universelle de la parole

Traitement Audio Et Vocal

Szu-Wei Fu, Rong Chao, Xuesong Yang, et al.

Des Gaussiennes 3D génératives avec un contrôle appris de la densité

Génération 3D

Modèle De Diffusion

Runjie Yan, Yan-Pei Cao, Peng Wang, et al.

TADA : Un cadre génératif pour la modélisation de la parole par double alignement texte-acoustique

Trung Dang, Sharath Rao, Ananya Gupta, et al.

Au-delà des mots isolés : Diffusion Brush pour la génération de lignes de texte manuscrites

Modèle De Diffusion

Génération D'images

Gang Dai, Yifan Zhang, Yutao Qin, et al.

gsplat : une bibliothèque open source pour le Gaussian Splatting

Vickie Ye, Ruilong Li, Justin Kerr, et al.

OmniVideo-100K : Un ensemble de données pour le raisonnement audiovisuel à travers des scripts structurés et des chaînes de preuve

Compréhension Vidéo

Réponse À Des Questions Visuelles

Xinyue Cai, Chaoyou Fu, Yi-Fan Zhang, et al.

OPEN-SWE-TRACES : Améliorer la distillation bilingue multilingue pour les Agents d’ingénierie logicielle

Génération De Code

Génération De Texte

Wasi Uddin Ahmad, Nikolai Ludwig, Somshubra Majumdar, et al.

Attribution de crédit avec réinitialisations dans le raisonnement des modèles de langage

Apprentissage Par Renforcement

Ankur Samanta, Akshayaa Magesh, Ayush Jain, et al.

OCR à l'infini : Bienvenue dans l'ère de l'analyse à court terme avec un seul exemple

Baoding Zhou, Jingyun Wang, Xiaolin Wei, et al.

PlanBench-XL : Évaluation de la planification à long horizon des agents d'utilisation d'outils LLM dans des écosystèmes d'outils à grande échelle

Jiayu Liu, Qihan Lin, Cheng Qian, et al.

OpenRath : État d'exécution centré sur la session pour les Systèmes Agent

Fukang Wen, Zhijie Wang, Ruilin Xu

EvoEmbedding : Représentations Évoluables pour la Récupération de Contexte Long et la Mémoire Agentic

Génération Augmentée Par La Recherche

Chang Nie, Chaoyou Fu, Junlan Feng, et al.

Apprendre de ses propres erreurs : Construire des trajectoires micro-réflexives apprenables pour l'auto-distillation

Apprentissage Par Renforcement

Zhilin Huang, Hang Gao, Ziqiang Dong, et al.

Modèles d'Action du Monde : Une Revue de Littérature

Génération De Vidéo

Qiuhong Shen, Shihua Zhang, Yue Liao, et al.

KaLM-Reranker-V1 : Rapide mais sans interaction tardive pour le réordonnancement de documents compressés

Xinping Zhao, Jiaxin Xu, Ziqi Dai, et al.

Repenser le biais de rétrécissement dans le pré-entraînement LLM en FP4 : origine géométrique, impact systémique et recette UFP4

Entraînement Du Modèle

Qian Zhao, Kunlong Chen, Changxin Tian, et al.

HydraHead : De l'hétérogénéité fonctionnelle de niveau tête à l'hybridation spécialisée de l'attention

Zhentao Tan, Wei Chen, Jingyi Shen, et al.

3DCodeBench : Évaluation des agents de modélisation 3D procédurale via le code

Génération De Code

Yipeng Gao, Lei Shu, Genzhi Ye, et al.

RadImageNet-VQA : Un grand ensemble de données CT et IRM pour la réponse visuelle à des questions en imagerie radiologique

Imagerie Médicale

Réponse À Des Questions Visuelles

Leo Butsanets, Charles Corbiere, Julien Khlaut, et al.

Entraînement des agents et des vérificateurs en génie logiciel avec SWE-Gym

Affinage Supervisé

Jiayi Pan, Xingyao Wang, Graham Neubig, et al.

Contrôle prédictif piloté par les données et à déclenchement d'événement, amélioré par l'apprentissage par renforcement profond, pour un bras robotique souple actionné par câbles 3D

Contrôle prédictif piloté par les données et à déclenchement d'événement, amélioré par l'apprentissage par renforcement profond, pour un bras robotique souple actionné par câbles 3D

Apprentissage Par Renforcement

Cheng Ouyang, Moeen Ul Islam, Kaixiang Zhang, et al.

Ungrokking naturel : Contrôle asymétrique des règles qui survivent au pré-entraînement

Ungrokking naturel : Contrôle asymétrique des règles qui survivent au pré-entraînement

Entraînement Du Modèle

Juliana Li, Diya Sreedhar

Tout entier non négatif est la somme d'un nombre triangulaire, d'un nombre pentagonal et d'un nombre heptagonal

Yichuan Cao, Dakai Guo, Ruichen Qiu, et al.

Ingénierie de boucle : Le manuel Anthropic pour concevoir des systèmes qui interrogent vos agents

Peter Steinberger, Boris Cherny, Addy Osmani

Petits LLM : Élagage vs Apprentissage à partir de zéro

Entraînement Du Modèle

Yufeng Xu, Taiming Lu, Kunjun Li, et al.

OpenThoughts-Agent : Recettes de données pour les modèles agents

Entraînement Du Modèle

Negin Raoof, Richard Zhuang, Marianna Nezhurina, et al.

LingxiDiagBench : Un cadre Multi-Agent pour le benchmarking de LLM dans la consultation et le diagnostic psychiatriques en chinois

Shihao Xu, Tiancheng Zhou, Jiatong Ma, et al.

AOHP : Un environnement open source de niveau OS pour Agent, Interaction personnalisée, efficace et sécurisée

Shanhui Zhao, Jiacheng Liu, Guohong Liu, et al.

MemGUI-Agent : Un Agent GUI Mobile de bout en bout à long horizon avec une gestion proactive du contexte

Guangyi Liu, Gao Wu, Congxiao Liu, et al.

MobileForge : Adaptation sans annotation pour les agents GUI mobiles avec une optimisation de politique guidée par les retours hiérarchiques

Guangyi Liu, Pengxiang Zhao, Gao Wu, et al.

NatureBench : Les Agents de codage peuvent-ils égaler le SOTA publié des articles de la famille Nature ?

IA Pour La Science

Yuru Wang, Lejun Cheng, Yuxin Zuo, et al.

Qwen-AgentWorld : Modèles de monde linguistiques pour agents généraux

Yuxin Zuo, Zikai Xiao, Li Sheng, et al.

Repenser les cibles d’entraînement, les architectures et la qualité des données pour l’amélioration universelle de la parole

Traitement Audio Et Vocal

Szu-Wei Fu, Rong Chao, Xuesong Yang, et al.

Des Gaussiennes 3D génératives avec un contrôle appris de la densité

Génération 3D

Modèle De Diffusion

Runjie Yan, Yan-Pei Cao, Peng Wang, et al.

TADA : Un cadre génératif pour la modélisation de la parole par double alignement texte-acoustique

Trung Dang, Sharath Rao, Ananya Gupta, et al.

Au-delà des mots isolés : Diffusion Brush pour la génération de lignes de texte manuscrites

Modèle De Diffusion

Génération D'images

Gang Dai, Yifan Zhang, Yutao Qin, et al.

gsplat : une bibliothèque open source pour le Gaussian Splatting

Vickie Ye, Ruilong Li, Justin Kerr, et al.

OmniVideo-100K : Un ensemble de données pour le raisonnement audiovisuel à travers des scripts structurés et des chaînes de preuve

Compréhension Vidéo

Réponse À Des Questions Visuelles

Xinyue Cai, Chaoyou Fu, Yi-Fan Zhang, et al.

OPEN-SWE-TRACES : Améliorer la distillation bilingue multilingue pour les Agents d’ingénierie logicielle

Génération De Code

Génération De Texte

Wasi Uddin Ahmad, Nikolai Ludwig, Somshubra Majumdar, et al.

Attribution de crédit avec réinitialisations dans le raisonnement des modèles de langage

Apprentissage Par Renforcement

Ankur Samanta, Akshayaa Magesh, Ayush Jain, et al.

OCR à l'infini : Bienvenue dans l'ère de l'analyse à court terme avec un seul exemple

Baoding Zhou, Jingyun Wang, Xiaolin Wei, et al.

PlanBench-XL : Évaluation de la planification à long horizon des agents d'utilisation d'outils LLM dans des écosystèmes d'outils à grande échelle

Jiayu Liu, Qihan Lin, Cheng Qian, et al.

OpenRath : État d'exécution centré sur la session pour les Systèmes Agent

Fukang Wen, Zhijie Wang, Ruilin Xu

EvoEmbedding : Représentations Évoluables pour la Récupération de Contexte Long et la Mémoire Agentic

Génération Augmentée Par La Recherche

Chang Nie, Chaoyou Fu, Junlan Feng, et al.

Apprendre de ses propres erreurs : Construire des trajectoires micro-réflexives apprenables pour l'auto-distillation

Apprentissage Par Renforcement

Zhilin Huang, Hang Gao, Ziqiang Dong, et al.

Modèles d'Action du Monde : Une Revue de Littérature

Génération De Vidéo

Qiuhong Shen, Shihua Zhang, Yue Liao, et al.

KaLM-Reranker-V1 : Rapide mais sans interaction tardive pour le réordonnancement de documents compressés

Xinping Zhao, Jiaxin Xu, Ziqi Dai, et al.

Repenser le biais de rétrécissement dans le pré-entraînement LLM en FP4 : origine géométrique, impact systémique et recette UFP4

Entraînement Du Modèle

Qian Zhao, Kunlong Chen, Changxin Tian, et al.

HydraHead : De l'hétérogénéité fonctionnelle de niveau tête à l'hybridation spécialisée de l'attention

Zhentao Tan, Wei Chen, Jingyi Shen, et al.

3DCodeBench : Évaluation des agents de modélisation 3D procédurale via le code

Génération De Code

Yipeng Gao, Lei Shu, Genzhi Ye, et al.

RadImageNet-VQA : Un grand ensemble de données CT et IRM pour la réponse visuelle à des questions en imagerie radiologique

Imagerie Médicale

Réponse À Des Questions Visuelles

Leo Butsanets, Charles Corbiere, Julien Khlaut, et al.

Entraînement des agents et des vérificateurs en génie logiciel avec SWE-Gym

Affinage Supervisé

Jiayi Pan, Xingyao Wang, Graham Neubig, et al.

Tout entier non négatif est la somme d'un nombre triangulaire, d'un nombre pentagonal et d'un nombre heptagonal

Ingénierie de boucle : Le manuel Anthropic pour concevoir des systèmes qui interrogent vos agents

Petits LLM : Élagage vs Apprentissage à partir de zéro

OpenThoughts-Agent : Recettes de données pour les modèles agents

LingxiDiagBench : Un cadre Multi-Agent pour le benchmarking de LLM dans la consultation et le diagnostic psychiatriques en chinois

AOHP : Un environnement open source de niveau OS pour Agent, Interaction personnalisée, efficace et sécurisée

MemGUI-Agent : Un Agent GUI Mobile de bout en bout à long horizon avec une gestion proactive du contexte

MobileForge : Adaptation sans annotation pour les agents GUI mobiles avec une optimisation de politique guidée par les retours hiérarchiques

NatureBench : Les Agents de codage peuvent-ils égaler le SOTA publié des articles de la famille Nature ?

Qwen-AgentWorld : Modèles de monde linguistiques pour agents généraux

Repenser les cibles d’entraînement, les architectures et la qualité des données pour l’amélioration universelle de la parole

Des Gaussiennes 3D génératives avec un contrôle appris de la densité

TADA : Un cadre génératif pour la modélisation de la parole par double alignement texte-acoustique

Au-delà des mots isolés : Diffusion Brush pour la génération de lignes de texte manuscrites

gsplat : une bibliothèque open source pour le Gaussian Splatting

OmniVideo-100K : Un ensemble de données pour le raisonnement audiovisuel à travers des scripts structurés et des chaînes de preuve

OPEN-SWE-TRACES : Améliorer la distillation bilingue multilingue pour les Agents d’ingénierie logicielle

Attribution de crédit avec réinitialisations dans le raisonnement des modèles de langage

OCR à l'infini : Bienvenue dans l'ère de l'analyse à court terme avec un seul exemple

PlanBench-XL : Évaluation de la planification à long horizon des agents d'utilisation d'outils LLM dans des écosystèmes d'outils à grande échelle

OpenRath : État d'exécution centré sur la session pour les Systèmes Agent

EvoEmbedding : Représentations Évoluables pour la Récupération de Contexte Long et la Mémoire Agentic

Apprendre de ses propres erreurs : Construire des trajectoires micro-réflexives apprenables pour l'auto-distillation

Modèles d'Action du Monde : Une Revue de Littérature

KaLM-Reranker-V1 : Rapide mais sans interaction tardive pour le réordonnancement de documents compressés

Repenser le biais de rétrécissement dans le pré-entraînement LLM en FP4 : origine géométrique, impact systémique et recette UFP4

HydraHead : De l'hétérogénéité fonctionnelle de niveau tête à l'hybridation spécialisée de l'attention

3DCodeBench : Évaluation des agents de modélisation 3D procédurale via le code

RadImageNet-VQA : Un grand ensemble de données CT et IRM pour la réponse visuelle à des questions en imagerie radiologique

Entraînement des agents et des vérificateurs en génie logiciel avec SWE-Gym

Tout entier non négatif est la somme d'un nombre triangulaire, d'un nombre pentagonal et d'un nombre heptagonal

Ingénierie de boucle : Le manuel Anthropic pour concevoir des systèmes qui interrogent vos agents

Petits LLM : Élagage vs Apprentissage à partir de zéro

OpenThoughts-Agent : Recettes de données pour les modèles agents

LingxiDiagBench : Un cadre Multi-Agent pour le benchmarking de LLM dans la consultation et le diagnostic psychiatriques en chinois

AOHP : Un environnement open source de niveau OS pour Agent, Interaction personnalisée, efficace et sécurisée

MemGUI-Agent : Un Agent GUI Mobile de bout en bout à long horizon avec une gestion proactive du contexte

MobileForge : Adaptation sans annotation pour les agents GUI mobiles avec une optimisation de politique guidée par les retours hiérarchiques

NatureBench : Les Agents de codage peuvent-ils égaler le SOTA publié des articles de la famille Nature ?

Qwen-AgentWorld : Modèles de monde linguistiques pour agents généraux

Repenser les cibles d’entraînement, les architectures et la qualité des données pour l’amélioration universelle de la parole

Des Gaussiennes 3D génératives avec un contrôle appris de la densité

TADA : Un cadre génératif pour la modélisation de la parole par double alignement texte-acoustique

Au-delà des mots isolés : Diffusion Brush pour la génération de lignes de texte manuscrites

gsplat : une bibliothèque open source pour le Gaussian Splatting

OmniVideo-100K : Un ensemble de données pour le raisonnement audiovisuel à travers des scripts structurés et des chaînes de preuve

OPEN-SWE-TRACES : Améliorer la distillation bilingue multilingue pour les Agents d’ingénierie logicielle

Attribution de crédit avec réinitialisations dans le raisonnement des modèles de langage

OCR à l'infini : Bienvenue dans l'ère de l'analyse à court terme avec un seul exemple

PlanBench-XL : Évaluation de la planification à long horizon des agents d'utilisation d'outils LLM dans des écosystèmes d'outils à grande échelle

OpenRath : État d'exécution centré sur la session pour les Systèmes Agent

EvoEmbedding : Représentations Évoluables pour la Récupération de Contexte Long et la Mémoire Agentic

Apprendre de ses propres erreurs : Construire des trajectoires micro-réflexives apprenables pour l'auto-distillation

Modèles d'Action du Monde : Une Revue de Littérature

KaLM-Reranker-V1 : Rapide mais sans interaction tardive pour le réordonnancement de documents compressés

Repenser le biais de rétrécissement dans le pré-entraînement LLM en FP4 : origine géométrique, impact systémique et recette UFP4

HydraHead : De l'hétérogénéité fonctionnelle de niveau tête à l'hybridation spécialisée de l'attention

3DCodeBench : Évaluation des agents de modélisation 3D procédurale via le code

RadImageNet-VQA : Un grand ensemble de données CT et IRM pour la réponse visuelle à des questions en imagerie radiologique

Entraînement des agents et des vérificateurs en génie logiciel avec SWE-Gym