Command Palette
Search for a command to run...
Papers
Articles de recherche en IA de pointe mis à jour quotidiennement pour vous aider à suivre les dernières tendances en IA

MOSPA : Génération de mouvements humains pilotée par l'audio spatial

MMHU : Un benchmark multimodal à grande échelle pour la compréhension du comportement humain































MOSPA : Génération de mouvements humains pilotée par l'audio spatial

MMHU : Un benchmark multimodal à grande échelle pour la compréhension du comportement humain






























PhysX : Génération d'Actifs 3D Basée sur la Physique
Vers une RAG agente avec un raisonnement profond : Une revue des systèmes de raisonnement RAG dans les LLMs
La-Proteina : Génération de protéines au niveau atomique par appariement de flux partiellement latents
SUICA : Apprentissage de représentations neuronales implicites parcimonieuses en très haute dimension pour la transcriptomique spatiale
XiChen : Un système de prévision météorologique mondial entièrement piloté par l'IA, à l'échelle des observations, avec une connaissance variationnelle 4D
AgentsNet : Coordination et Raisonnement Collaboratif dans les LLMs Multi-Agents
Les modèles fondamentaux multimodaux peuvent-ils comprendre les diagrammes schématiques ? Une étude empirique sur la Q&A de recherche d'information dans les articles scientifiques
Lois d'échelle pour les mélanges de données optimaux
Génération d'images à partir de texte avec cohérence du sujet et diversité des poses
Vision-Langage-Vision Auto-Encodeur : Distillation de Connaissances Évolutives à Partir des Modèles de Diffusion
DuetGraph : Raisonnement dans les graphes de connaissances de manière grossière à fine avec une fusion globale-locale à double voie
CogDDN : Une Navigation Guidée par la Demande Cognitive avec Optimisation de la Décision et Pensée à Deux Processus
LayerCake : Décodage contrastif sensible aux jetons au sein des couches de grands modèles linguistiques
Mélange-de-Récursions : Apprentissage de Profondeurs Récursives Dynamiques pour le Calcul Adaptatif au Niveau des Tokens
REST : Test de stress des grands modèles de raisonnement en posant plusieurs problèmes à la fois
EmbRACE-3K : Raisonnement et Action Corporels dans des Environnements Complexes
Raisonnement ou Mémorisation ? Résultats Non Fiables de l'Apprentissage par Renforcement En raison de la Contamination des Données
SpeakerVid-5M : Un grand ensemble de données de haute qualité pour la génération d'interactions dyadiques audiovisuelles humaines
VerifyBench : Un Benchmark Systématique pour Évaluer les Vérificateurs de Raisonnement dans Différents Domaines
Conditionnement et modélisation des chaînes latérales pour la conception de séquences protéiques à atomes complets avec FAMPNN
Un Jeton pour Tromper les LLM en tant que Juge
De l’un à plusieurs : Latents partiels contextuels pour la génération 3D
Open Vision Reasoner : Transfert du Comportement Cognitif Linguistique pour la Raisonnement Visuel
Lumos-1 : Sur la Génération Vidéo Autoregressive à Partir d'une Perspective de Modèle Unifié
Édition d'images pilotée par les neurones
CLiFT : Tokens de Champ Lumineux Compressés pour un Rendu Neuronal Économique en Calcul et Adaptatif
Modélisation et Optimisation des Systèmes de Systèmes : Un Cadre Intégré pour la Mobilité Intermodale
Transformateurs de diffusion à tous les atomes : Modélisation générative unifiée des molécules et des matériaux
OST-Bench : Évaluation des capacités des MLLMs dans la compréhension en ligne des scènes spatio-temporelles
Évaluation et Méthodologie du Raisonnement Visuel Ancré Basé sur des Preuves Traçables
PhysX : Génération d'Actifs 3D Basée sur la Physique
Vers une RAG agente avec un raisonnement profond : Une revue des systèmes de raisonnement RAG dans les LLMs
La-Proteina : Génération de protéines au niveau atomique par appariement de flux partiellement latents
SUICA : Apprentissage de représentations neuronales implicites parcimonieuses en très haute dimension pour la transcriptomique spatiale
XiChen : Un système de prévision météorologique mondial entièrement piloté par l'IA, à l'échelle des observations, avec une connaissance variationnelle 4D
AgentsNet : Coordination et Raisonnement Collaboratif dans les LLMs Multi-Agents
Les modèles fondamentaux multimodaux peuvent-ils comprendre les diagrammes schématiques ? Une étude empirique sur la Q&A de recherche d'information dans les articles scientifiques
Lois d'échelle pour les mélanges de données optimaux
Génération d'images à partir de texte avec cohérence du sujet et diversité des poses
Vision-Langage-Vision Auto-Encodeur : Distillation de Connaissances Évolutives à Partir des Modèles de Diffusion
DuetGraph : Raisonnement dans les graphes de connaissances de manière grossière à fine avec une fusion globale-locale à double voie
CogDDN : Une Navigation Guidée par la Demande Cognitive avec Optimisation de la Décision et Pensée à Deux Processus
LayerCake : Décodage contrastif sensible aux jetons au sein des couches de grands modèles linguistiques
Mélange-de-Récursions : Apprentissage de Profondeurs Récursives Dynamiques pour le Calcul Adaptatif au Niveau des Tokens
REST : Test de stress des grands modèles de raisonnement en posant plusieurs problèmes à la fois
EmbRACE-3K : Raisonnement et Action Corporels dans des Environnements Complexes
Raisonnement ou Mémorisation ? Résultats Non Fiables de l'Apprentissage par Renforcement En raison de la Contamination des Données
SpeakerVid-5M : Un grand ensemble de données de haute qualité pour la génération d'interactions dyadiques audiovisuelles humaines
VerifyBench : Un Benchmark Systématique pour Évaluer les Vérificateurs de Raisonnement dans Différents Domaines
Conditionnement et modélisation des chaînes latérales pour la conception de séquences protéiques à atomes complets avec FAMPNN
Un Jeton pour Tromper les LLM en tant que Juge
De l’un à plusieurs : Latents partiels contextuels pour la génération 3D
Open Vision Reasoner : Transfert du Comportement Cognitif Linguistique pour la Raisonnement Visuel
Lumos-1 : Sur la Génération Vidéo Autoregressive à Partir d'une Perspective de Modèle Unifié
Édition d'images pilotée par les neurones
CLiFT : Tokens de Champ Lumineux Compressés pour un Rendu Neuronal Économique en Calcul et Adaptatif
Modélisation et Optimisation des Systèmes de Systèmes : Un Cadre Intégré pour la Mobilité Intermodale
Transformateurs de diffusion à tous les atomes : Modélisation générative unifiée des molécules et des matériaux
OST-Bench : Évaluation des capacités des MLLMs dans la compréhension en ligne des scènes spatio-temporelles
Évaluation et Méthodologie du Raisonnement Visuel Ancré Basé sur des Preuves Traçables