Command Palette
Search for a command to run...
Papers
Articles de recherche en IA de pointe mis à jour quotidiennement pour vous aider à suivre les dernières tendances en IA

ViMU : Évaluation de la compréhension des métaphores vidéo

SMOL : Données parallèles professionnellement traduites pour 115 langues sous-représentées































ViMU : Évaluation de la compréhension des métaphores vidéo

SMOL : Données parallèles professionnellement traduites pour 115 langues sous-représentées






























Chi-Bench : Les agents d’IA peuvent-ils automatiser des workflows de santé complets, à long terme et riches en politiques ?
Combinaison de l’optimisation on-policy et de la distillation pour le raisonnement à long contexte dans les grands modèles de langage
À travers le prisme du contraste : auto-amélioration du raisonnement visuel dans les VLMs
HRM-Text: Un préentraînement efficace au-delà de la mise à l’échelle
Voir ce que je veux dire : Aligner les représentations visuelles et linguistiques pour la compréhension fine des objets dans les vidéos
Rapport technique StepAudio 2.5
SciAtlas : Un graphe de connaissances à grande échelle pour la recherche scientifique automatisée
Repenser le routage de l'information inter-couches dans les Transformers de diffusion
Lens : Repenser l'efficacité de l'entraînement pour les modèles fondamentaux de texte vers image
SkillOpt : Stratégie exécutive pour des compétences d'agent auto-évoluant
CVEvolve : Découverte autonome d'algorithmes pour le traitement des données scientifiques non structurées
Poly-EPO : Entraînement des modèles de raisonnement exploratoire
Résumé
ACC : Compilation des trajectoires d'agents pour l'entraînement à long contexte
L'attention complète frappe à nouveau : transférer l'attention complète en attention sparse en quelques centaines d'étapes d'entraînement
π-Bench : Évaluation des agents assistants personnels proactifs dans les workflows à long terme
Perception ou préjugé : les MLLMs peuvent-ils aller au-delà des premières impressions de personnalité ?
TransitLM : un jeu de données et un benchmark à grande échelle pour la génération d'itinéraires de transport en commun sans carte
DelTA : Attribution discriminative de crédit de token pour l'apprentissage par renforcement à partir de récompenses vérifiables
L'évaluation interactive nécessite une approche de science du design
ESI-BENCH : Vers une intelligence spatiale incarnée qui referme la boucle perception-action
Analyse comparative de la détection militaire à l'aide d'images de drones à travers plusieurs spectres visuels
Classification automatisée des diagnostics psychiatriques selon la CIM : des méthodes classiques de TALN aux grands modèles de langage
Gestion coordonnée et optimale de la qualité de l'alimentation dans les réseaux de distribution en utilisant la capacité résiduelle des IBR communautaires
EllipseLIO : Odométrie LiDAR inertielle adaptative avec une représentation ellipsoïdale
SMoA : Adaptateur de modulation de spectre pour le réglage fin efficace en paramètres
Détection des réseaux de neurones artificiels profonds piégés par analyse de régression spectrale
L'illusion de la pensée : comprendre les forces et les limites des modèles de raisonnement à travers le prisme de la complexité des problèmes
Raisonnement Récursif Génératif
Pré-entraînement de sécurité : vers une nouvelle génération d'IA sécurisée
Chi-Bench : Les agents d’IA peuvent-ils automatiser des workflows de santé complets, à long terme et riches en politiques ?
Combinaison de l’optimisation on-policy et de la distillation pour le raisonnement à long contexte dans les grands modèles de langage
À travers le prisme du contraste : auto-amélioration du raisonnement visuel dans les VLMs
HRM-Text: Un préentraînement efficace au-delà de la mise à l’échelle
Voir ce que je veux dire : Aligner les représentations visuelles et linguistiques pour la compréhension fine des objets dans les vidéos
Rapport technique StepAudio 2.5
SciAtlas : Un graphe de connaissances à grande échelle pour la recherche scientifique automatisée
Repenser le routage de l'information inter-couches dans les Transformers de diffusion
Lens : Repenser l'efficacité de l'entraînement pour les modèles fondamentaux de texte vers image
SkillOpt : Stratégie exécutive pour des compétences d'agent auto-évoluant
CVEvolve : Découverte autonome d'algorithmes pour le traitement des données scientifiques non structurées
Poly-EPO : Entraînement des modèles de raisonnement exploratoire
Résumé
ACC : Compilation des trajectoires d'agents pour l'entraînement à long contexte
L'attention complète frappe à nouveau : transférer l'attention complète en attention sparse en quelques centaines d'étapes d'entraînement
π-Bench : Évaluation des agents assistants personnels proactifs dans les workflows à long terme
Perception ou préjugé : les MLLMs peuvent-ils aller au-delà des premières impressions de personnalité ?
TransitLM : un jeu de données et un benchmark à grande échelle pour la génération d'itinéraires de transport en commun sans carte
DelTA : Attribution discriminative de crédit de token pour l'apprentissage par renforcement à partir de récompenses vérifiables
L'évaluation interactive nécessite une approche de science du design
ESI-BENCH : Vers une intelligence spatiale incarnée qui referme la boucle perception-action
Analyse comparative de la détection militaire à l'aide d'images de drones à travers plusieurs spectres visuels
Classification automatisée des diagnostics psychiatriques selon la CIM : des méthodes classiques de TALN aux grands modèles de langage
Gestion coordonnée et optimale de la qualité de l'alimentation dans les réseaux de distribution en utilisant la capacité résiduelle des IBR communautaires
EllipseLIO : Odométrie LiDAR inertielle adaptative avec une représentation ellipsoïdale
SMoA : Adaptateur de modulation de spectre pour le réglage fin efficace en paramètres
Détection des réseaux de neurones artificiels profonds piégés par analyse de régression spectrale
L'illusion de la pensée : comprendre les forces et les limites des modèles de raisonnement à travers le prisme de la complexité des problèmes
Raisonnement Récursif Génératif
Pré-entraînement de sécurité : vers une nouvelle génération d'IA sécurisée