Command Palette
Search for a command to run...
Papers
Articles de recherche en IA de pointe mis à jour quotidiennement pour vous aider à suivre les dernières tendances en IA

Vision2Web : une évaluation hiérarchisée pour le développement visuel de sites web avec vérification par Agent

ViGoR-Bench : À quel point les modèles génératifs visuels sont-ils éloignés des raisonneurs visuels en zero-shot ?































Vision2Web : une évaluation hiérarchisée pour le développement visuel de sites web avec vérification par Agent

ViGoR-Bench : À quel point les modèles génératifs visuels sont-ils éloignés des raisonneurs visuels en zero-shot ?






























MiroEval : Évaluation des Agents de Recherche Profonde Multimodaux selon le Processus et le Résultat
Les agents terminaux suffisent pour l'automatisation d'entreprise.
ClawKeeper : Protection de sécurité complète pour les agents OpenClaw grâce aux Skills, Plugins et Watchers
Bootstrap bon marché pour une quantification rapide de l'incertitude dans la descente de gradient stochastique
L'IA générative permet la construction de réseaux cérébraux structuraux à partir de l'IRMf grâce à l'apprentissage par Diffusion symétrique.
Réseaux de neurones à codage prédictif avec sortie anticipée pour l'IA de périphérie
Quadratique Gradient : Un cadre unifié reliant la descente de gradient et les méthodes de type Newton par la synthèse des Hessiens et des gradients
Région de capacité des classes de canaux de diffusion à produits
Colon-Bench : un workflow agentic pour l'annotation évolutive de lésions denses dans les vidéos de coloscopie complètes
TOOLACE : MAÎTRISER LES ENJEUX DE L'APPEL DE FONCTIONS PAR LES LLM
LightMover : Génération de mouvements lumineux avec contrôles de couleur et d'intensité
Optimisation de trajectoire de dépassement autonome par apprentissage par renforcement et estimation de la pose de l'adversaire
Créez-le : Images factices, gains réels en segmentation sémantique few-shot généralisée
Adaptation acoustique en deux étapes avec des adaptateurs à attention croisée à portes pour la reconnaissance de la parole multi-locuteurs basée sur des LLM
Étude comparative en chirurgie assistée par l'IA : jeux de données, modèles de fondation et obstacles à l'AGI médicale
Intégration des données textuelles
Génération unifiée de texte vers mouvement sans nombre via l'appariement de flux
SEAR : Évaluation et routage basés sur le schéma pour les passerelles LLM
Répulsion en temps réel dans l'espace contextuel pour une diversité accrue dans les Diffusion Transformers
EpochX : Construire l'infrastructure d'une civilisation d'agents émergente
TAPS : Distributions de propositions conscientes de la tâche pour l'échantillonnage spéculatif
Scénarios de conduite à longue traîne avec traces de raisonnement : le jeu de données KITScenes LongTail
RealChart2Code : Faire progresser la génération de code à partir de graphiques grâce à des données réelles et une évaluation multi-tâches
Trace2Skill : Distiller des leçons locales aux trajectoires en compétences d'Agent transférables
PackForcing : Un entraînement sur des vidéos courtes suffit pour l'échantillonnage de vidéos longues et l'inférence en contexte long
ShotStream : Génération vidéo multi-shot en flux continu pour la narration interactive
Hors de vue mais pas hors de l'esprit : une mémoire hybride pour les modèles de monde vidéo dynamiques
BeSafe-Bench : Mise en lumière des risques de sécurité comportementale des Agents situés dans des environnements fonctionnels
Arène de Raisonnement du Monde (World Reasoning Arena)
MSA : Mécanisme d'attention parcimonieuse en mémoire pour une mise à l'échelle efficace de modèles de mémoire de bout en bout jusqu'à 100M tokens
MiroEval : Évaluation des Agents de Recherche Profonde Multimodaux selon le Processus et le Résultat
Les agents terminaux suffisent pour l'automatisation d'entreprise.
ClawKeeper : Protection de sécurité complète pour les agents OpenClaw grâce aux Skills, Plugins et Watchers
Bootstrap bon marché pour une quantification rapide de l'incertitude dans la descente de gradient stochastique
L'IA générative permet la construction de réseaux cérébraux structuraux à partir de l'IRMf grâce à l'apprentissage par Diffusion symétrique.
Réseaux de neurones à codage prédictif avec sortie anticipée pour l'IA de périphérie
Quadratique Gradient : Un cadre unifié reliant la descente de gradient et les méthodes de type Newton par la synthèse des Hessiens et des gradients
Région de capacité des classes de canaux de diffusion à produits
Colon-Bench : un workflow agentic pour l'annotation évolutive de lésions denses dans les vidéos de coloscopie complètes
TOOLACE : MAÎTRISER LES ENJEUX DE L'APPEL DE FONCTIONS PAR LES LLM
LightMover : Génération de mouvements lumineux avec contrôles de couleur et d'intensité
Optimisation de trajectoire de dépassement autonome par apprentissage par renforcement et estimation de la pose de l'adversaire
Créez-le : Images factices, gains réels en segmentation sémantique few-shot généralisée
Adaptation acoustique en deux étapes avec des adaptateurs à attention croisée à portes pour la reconnaissance de la parole multi-locuteurs basée sur des LLM
Étude comparative en chirurgie assistée par l'IA : jeux de données, modèles de fondation et obstacles à l'AGI médicale
Intégration des données textuelles
Génération unifiée de texte vers mouvement sans nombre via l'appariement de flux
SEAR : Évaluation et routage basés sur le schéma pour les passerelles LLM
Répulsion en temps réel dans l'espace contextuel pour une diversité accrue dans les Diffusion Transformers
EpochX : Construire l'infrastructure d'une civilisation d'agents émergente
TAPS : Distributions de propositions conscientes de la tâche pour l'échantillonnage spéculatif
Scénarios de conduite à longue traîne avec traces de raisonnement : le jeu de données KITScenes LongTail
RealChart2Code : Faire progresser la génération de code à partir de graphiques grâce à des données réelles et une évaluation multi-tâches
Trace2Skill : Distiller des leçons locales aux trajectoires en compétences d'Agent transférables
PackForcing : Un entraînement sur des vidéos courtes suffit pour l'échantillonnage de vidéos longues et l'inférence en contexte long
ShotStream : Génération vidéo multi-shot en flux continu pour la narration interactive
Hors de vue mais pas hors de l'esprit : une mémoire hybride pour les modèles de monde vidéo dynamiques
BeSafe-Bench : Mise en lumière des risques de sécurité comportementale des Agents situés dans des environnements fonctionnels
Arène de Raisonnement du Monde (World Reasoning Arena)
MSA : Mécanisme d'attention parcimonieuse en mémoire pour une mise à l'échelle efficace de modèles de mémoire de bout en bout jusqu'à 100M tokens