Command Palette
Search for a command to run...
Papers
Articles de recherche en IA de pointe mis à jour quotidiennement pour vous aider à suivre les dernières tendances en IA

PRISM : Pré-alignement par distillation on-policy en boîte noire pour l'apprentissage par renforcement multimodal

ARIS : Recherche autonome par collaboration multi-agents adversariale































PRISM : Pré-alignement par distillation on-policy en boîte noire pour l'apprentissage par renforcement multimodal

ARIS : Recherche autonome par collaboration multi-agents adversariale






























ProgramBench : Les modèles de langage peuvent-ils reconstruire des programmes à partir de zéro ?
Calcul efficace et accéléré de la distance d'édition de graphe sur GPU
Évaluation de l'incertitude des signaux situationnels des médias sociaux pour la couverture d'actualité en situation de crise à l'aide de LLM
LST Canonique : Une solution de liquid staking native au protocole pour Tezos
Séparer l’intelligence de l’exécution : un moteur de flux de travail pour le Modèle Contextuel de Protocol
Comprendre le plateau de performance dans la récupération de vidéos à partir de texte : Une analyse empirique et linguistique complète
La mémoire visuelle persistante : Maintien de la perception pour la génération profonde dans les LVLMs
EnergAIzer : Un cadre d'estimation rapide et précise de la puissance GPU pour les charges de travail IA
Exploiter l'apprentissage par renforcement basé sur les vérificateurs dans l'édition d'images
Entraînement efficace sur plusieurs GPU grand public avec RoundPipe
ExoActor : Génération vidéo exocentrique comme contrôle humanoid interactif généralisable
Distillation de politiques co-évoluantes
Génération visuelle à l’ère nouvelle : une évolution de la cartographie atomique à la modélisation du monde par agents
Collaboration de modèles de fondation scientifiques hétérogènes
Modèles de diffusion : Un cadre d’intégration unifié pour la diffusion contrôlable
RADIO-ViPE : Fusion multimodale en ligne et fortement couplée pour le SLAM sémantique à vocabulaire ouvert dans des environnements dynamiques
ClawGym : Un cadre évolutif pour construire des agents Griffes efficaces
Transformer le TIDE : Distillation inter-architecture pour les grands modèles linguistiques basés sur des Diffusions
Les grands modèles linguistiques explorent par distillation latente
GLM-5V-Turbo : vers un modèle de fondation natif pour les agents multimodaux
SWE-chat : Interactions entre agents de codage et utilisateurs réels dans la nature
AdaExplore : Adaptation pilotée par les échecs et recherche préservant la diversité pour la génération efficace de noyaux
Affinement par régénération : L'élargissement de l'espace de modification améliore l'affinement d'image dans les modèles multimodaux unifiés
AutoResearchBench : Évaluation des agents IA dans la découverte complexe de la littérature scientifique
Meta-CoT : Amélioration de la granularité et de la généralisation dans l'édition d'images
DV-World : Évaluation des agents de visualisation de données dans des scénarios du monde réel
Programmation avec des données : Ingénierie des données axée sur les tests pour des LLM auto-améliorants à partir de corpus bruts
Systèmes multi-agents récursifs
Récupération de compétences pour l'IA Agentique
SketchVLM : Les modèles de langage visuel peuvent annoter des images pour expliquer les pensées et guider les utilisateurs
ProgramBench : Les modèles de langage peuvent-ils reconstruire des programmes à partir de zéro ?
Calcul efficace et accéléré de la distance d'édition de graphe sur GPU
Évaluation de l'incertitude des signaux situationnels des médias sociaux pour la couverture d'actualité en situation de crise à l'aide de LLM
LST Canonique : Une solution de liquid staking native au protocole pour Tezos
Séparer l’intelligence de l’exécution : un moteur de flux de travail pour le Modèle Contextuel de Protocol
Comprendre le plateau de performance dans la récupération de vidéos à partir de texte : Une analyse empirique et linguistique complète
La mémoire visuelle persistante : Maintien de la perception pour la génération profonde dans les LVLMs
EnergAIzer : Un cadre d'estimation rapide et précise de la puissance GPU pour les charges de travail IA
Exploiter l'apprentissage par renforcement basé sur les vérificateurs dans l'édition d'images
Entraînement efficace sur plusieurs GPU grand public avec RoundPipe
ExoActor : Génération vidéo exocentrique comme contrôle humanoid interactif généralisable
Distillation de politiques co-évoluantes
Génération visuelle à l’ère nouvelle : une évolution de la cartographie atomique à la modélisation du monde par agents
Collaboration de modèles de fondation scientifiques hétérogènes
Modèles de diffusion : Un cadre d’intégration unifié pour la diffusion contrôlable
RADIO-ViPE : Fusion multimodale en ligne et fortement couplée pour le SLAM sémantique à vocabulaire ouvert dans des environnements dynamiques
ClawGym : Un cadre évolutif pour construire des agents Griffes efficaces
Transformer le TIDE : Distillation inter-architecture pour les grands modèles linguistiques basés sur des Diffusions
Les grands modèles linguistiques explorent par distillation latente
GLM-5V-Turbo : vers un modèle de fondation natif pour les agents multimodaux
SWE-chat : Interactions entre agents de codage et utilisateurs réels dans la nature
AdaExplore : Adaptation pilotée par les échecs et recherche préservant la diversité pour la génération efficace de noyaux
Affinement par régénération : L'élargissement de l'espace de modification améliore l'affinement d'image dans les modèles multimodaux unifiés
AutoResearchBench : Évaluation des agents IA dans la découverte complexe de la littérature scientifique
Meta-CoT : Amélioration de la granularité et de la généralisation dans l'édition d'images
DV-World : Évaluation des agents de visualisation de données dans des scénarios du monde réel
Programmation avec des données : Ingénierie des données axée sur les tests pour des LLM auto-améliorants à partir de corpus bruts
Systèmes multi-agents récursifs
Récupération de compétences pour l'IA Agentique
SketchVLM : Les modèles de langage visuel peuvent annoter des images pour expliquer les pensées et guider les utilisateurs