Command Palette
Search for a command to run...
Papers
Articles de recherche en IA de pointe mis à jour quotidiennement pour vous aider à suivre les dernières tendances en IA

YoCausal : À quelle distance la génération de vidéos se trouve-t-elle du modèle du monde ? Une perspective causale

minWM : Un framework full-stack open-source pour des modèles du monde vidéo interactifs en temps réel

CollectionLoRA : Collecter 50 effets dans 1 LoRA via la distillation on-policy multi-enseignant

OmniRetrieval : Récupération unifiée à travers des sources de connaissances hétérogènes

Qwen-VLA : Unification de la modélisation vision-langage-action à travers les tâches, les environnements et les incarnations robotiques

AgentDoG 1.5 : Un cadre d'alignement léger et évolutif pour la sécurité et la sûreté des Agent IA

Modèles d'action mondiaux : La prochaine frontière en IA incarnée

Les modèles d'action mondiaux sont des politiques zéro-shot

ResearchMath-14K : Mise à l'échelle des mathématiques de niveau recherche via Agents

Modèles de Langage Auto-Améliorants avec Recherche Évolutionnaire Bidirectionnelle

Des Pixels aux Mots -- Vers des Modèles Natifs One-Vision à Grande Échelle

Optimisation de la politique exploratoire d'Agent pour le raisonnement agentique multimodal

ProRL : Apprentissage par renforcement efficace pour la recommandation proactive via l'estimation du gradient de politique rectifié

Gamma-World : Modélisation générative du monde Multi-Agent au-delà de deux joueurs

AutoFigure : Génération et affinement d'illustrations scientifiques prêtes à être publiées

AutoResearch AI : Vers une automatisation de la recherche scientifique par l’intelligence artificielle pour la découverte scientifique

Ingénierie des agents : un état de l'art

D2-Monitor : Surveillance dynamique de la sécurité pour les LLMs de diffusion via un routage sensible à l'hésitation

Débruitage de représentation conscient de la géométrie pour la reconstruction 3D multi-vues robuste

EvalVerse : Évaluation consciente du pipeline et calibrée par des experts pour la génération de vidéos cinématographiques professionnelles

MobileGym : Une plateforme de simulation vérifiable et hautement parallèle pour la recherche sur les Mobile GUI Agent

SpatialBench : Votre modèle fondamental spatial est-il un joueur polyvalent ?

LocateAnything : Ancrage vision-langage rapide et de haute qualité avec décodage parallèle de boîtes

Gemini Embedding 2 : Un modèle d’embedding multimodal natif de Gemini

Les modèles de langage ont besoin de sommeil

ECHO : Les agents terminaux apprennent des modèles du monde gratuitement

ParaVT : Dompter le paradoxe de l'antériorité des outils pour l'utilisation parallèle des outils dans l'apprentissage par renforcement vidéo agentique

TriSplat : Reconstruction de scènes 3D en avant-prévision prête pour la simulation

Protocole de fondation : une couche de coordination pour la société agentique

WBench : Un benchmark complet multi-tours pour l'évaluation des modèles de monde vidéo interactifs

Macaron-A2UI : Un modèle pour l'interface utilisateur générative dans les agents personnels

DVAO : Optimisation dynamique de l'avantage à variance adaptative pour l'apprentissage par renforcement multi-récompense

YoCausal : À quelle distance la génération de vidéos se trouve-t-elle du modèle du monde ? Une perspective causale

minWM : Un framework full-stack open-source pour des modèles du monde vidéo interactifs en temps réel

CollectionLoRA : Collecter 50 effets dans 1 LoRA via la distillation on-policy multi-enseignant

OmniRetrieval : Récupération unifiée à travers des sources de connaissances hétérogènes

Qwen-VLA : Unification de la modélisation vision-langage-action à travers les tâches, les environnements et les incarnations robotiques

AgentDoG 1.5 : Un cadre d'alignement léger et évolutif pour la sécurité et la sûreté des Agent IA

Modèles d'action mondiaux : La prochaine frontière en IA incarnée

Les modèles d'action mondiaux sont des politiques zéro-shot

ResearchMath-14K : Mise à l'échelle des mathématiques de niveau recherche via Agents

Modèles de Langage Auto-Améliorants avec Recherche Évolutionnaire Bidirectionnelle

Des Pixels aux Mots -- Vers des Modèles Natifs One-Vision à Grande Échelle

Optimisation de la politique exploratoire d'Agent pour le raisonnement agentique multimodal

ProRL : Apprentissage par renforcement efficace pour la recommandation proactive via l'estimation du gradient de politique rectifié

Gamma-World : Modélisation générative du monde Multi-Agent au-delà de deux joueurs

AutoFigure : Génération et affinement d'illustrations scientifiques prêtes à être publiées

AutoResearch AI : Vers une automatisation de la recherche scientifique par l’intelligence artificielle pour la découverte scientifique

Ingénierie des agents : un état de l'art

D2-Monitor : Surveillance dynamique de la sécurité pour les LLMs de diffusion via un routage sensible à l'hésitation

Débruitage de représentation conscient de la géométrie pour la reconstruction 3D multi-vues robuste

EvalVerse : Évaluation consciente du pipeline et calibrée par des experts pour la génération de vidéos cinématographiques professionnelles

MobileGym : Une plateforme de simulation vérifiable et hautement parallèle pour la recherche sur les Mobile GUI Agent

SpatialBench : Votre modèle fondamental spatial est-il un joueur polyvalent ?

LocateAnything : Ancrage vision-langage rapide et de haute qualité avec décodage parallèle de boîtes

Gemini Embedding 2 : Un modèle d’embedding multimodal natif de Gemini

Les modèles de langage ont besoin de sommeil

ECHO : Les agents terminaux apprennent des modèles du monde gratuitement

ParaVT : Dompter le paradoxe de l'antériorité des outils pour l'utilisation parallèle des outils dans l'apprentissage par renforcement vidéo agentique

TriSplat : Reconstruction de scènes 3D en avant-prévision prête pour la simulation

Protocole de fondation : une couche de coordination pour la société agentique

WBench : Un benchmark complet multi-tours pour l'évaluation des modèles de monde vidéo interactifs

Macaron-A2UI : Un modèle pour l'interface utilisateur générative dans les agents personnels

DVAO : Optimisation dynamique de l'avantage à variance adaptative pour l'apprentissage par renforcement multi-récompense