Command Palette
Search for a command to run...
Papers
Articles de recherche en IA de pointe mis à jour quotidiennement pour vous aider à suivre les dernières tendances en IA

MegActor : Exploiter la puissance de la vidéo brute pour une animation de portrait vivante

Flash-VStream : Compréhension en temps réel basée sur la mémoire pour les flux vidéo longs































MegActor : Exploiter la puissance de la vidéo brute pour une animation de portrait vivante

Flash-VStream : Compréhension en temps réel basée sur la mémoire pour les flux vidéo longs






























PhotoMaker : Personnalisation de photos humaines réalistes via un empilement d'embeddings d'identité
StoryDiffusion : Auto-attention cohérente pour la génération d'images et de vidéos à longue portée
Démonstration de traduction automatique Cherokee-Anglais avec estimation de la qualité et rétroaction corrective
Algorithme en ligne pour la réponse à la demande avec des demandes inélastiques et une contrainte de puissance apparente
ESPnet-SDS : Boîte à outils et démonstration unifiées pour les systèmes de dialogue parlé
Jais et Jais-chat : modèles de langage génératifs à grande échelle ouverts, de base et ajustés pour l'instruction, centrés sur l'arabe
Traduction arrière rapide pour la traduction automatique non supervisée
Un cadre de traitement du langage naturel (NLP) ouvert pour la recherche clinique basée sur les dossiers de santé électroniques : une démonstration de cas utilisant le Collaboratif national de cohorte COVID (N3C)
Inpainting audio basé sur la diffusion
Segmentation panoptique en un clic : appliquée aux données agricoles
Hunyuan-Large : Un modèle MoE open-source avec 52 milliards de paramètres activés par Tencent
SketchAgent : Génération séquentielle de croquis pilotée par le langage
Dynamique de pontage hydrique de la réaction en chaîne par polymérase dans le paradigme de la théorie de jauge des champs quantiques
Recherches automatiques de documents sur Microsoft Academic : Précision pour les articles de revue et pertinence pour l'analyse des citations
OSS PESTO : Un outil d'évaluation et de sélection de projets de logiciels open source
Prédiction de complexes protéine-ligand conscients de l'état en utilisant AlphaFold3 avec des séquences purifiées
Petits mais significatifs : sur le potentiel des petits modèles de langage pour l'AIED accessible
Évaluation et amélioration de la robustesse du filigrane textuel pour SynthID de Google
CharacterGen : Génération efficace de personnages 3D à partir d'images uniques avec canonicalisation de la pose multi-vues
AnyText : Génération et édition de texte visuel multilingue
Moderniser les anciennes photos en utilisant plusieurs références via un transfert de style photoréaliste
YOLOv11 démystifié : un guide pratique pour la détection d'objets haute performance
SGDFuse : Modèle de diffusion guidé par SAM pour la fusion d'images infrarouges et visibles de haute fidélité
Le titre est vide. Veuillez fournir le titre à traduire.
Le titre est vide. Veuillez fournir le titre à traduire.
DeepSeek-Prover-V1.5 : Exploiter les retours des assistants de preuve pour l'apprentissage par renforcement et la recherche arborescente de Monte-Carlo
LLaVA-OneVision : Transfert facile des tâches visuelles
Le titre est vide. Veuillez fournir le titre à traduire.
Le titre est vide. Veuillez fournir le titre à traduire.
Le titre est vide. Veuillez fournir le titre à traduire.
PhotoMaker : Personnalisation de photos humaines réalistes via un empilement d'embeddings d'identité
StoryDiffusion : Auto-attention cohérente pour la génération d'images et de vidéos à longue portée
Démonstration de traduction automatique Cherokee-Anglais avec estimation de la qualité et rétroaction corrective
Algorithme en ligne pour la réponse à la demande avec des demandes inélastiques et une contrainte de puissance apparente
ESPnet-SDS : Boîte à outils et démonstration unifiées pour les systèmes de dialogue parlé
Jais et Jais-chat : modèles de langage génératifs à grande échelle ouverts, de base et ajustés pour l'instruction, centrés sur l'arabe
Traduction arrière rapide pour la traduction automatique non supervisée
Un cadre de traitement du langage naturel (NLP) ouvert pour la recherche clinique basée sur les dossiers de santé électroniques : une démonstration de cas utilisant le Collaboratif national de cohorte COVID (N3C)
Inpainting audio basé sur la diffusion
Segmentation panoptique en un clic : appliquée aux données agricoles
Hunyuan-Large : Un modèle MoE open-source avec 52 milliards de paramètres activés par Tencent
SketchAgent : Génération séquentielle de croquis pilotée par le langage
Dynamique de pontage hydrique de la réaction en chaîne par polymérase dans le paradigme de la théorie de jauge des champs quantiques
Recherches automatiques de documents sur Microsoft Academic : Précision pour les articles de revue et pertinence pour l'analyse des citations
OSS PESTO : Un outil d'évaluation et de sélection de projets de logiciels open source
Prédiction de complexes protéine-ligand conscients de l'état en utilisant AlphaFold3 avec des séquences purifiées
Petits mais significatifs : sur le potentiel des petits modèles de langage pour l'AIED accessible
Évaluation et amélioration de la robustesse du filigrane textuel pour SynthID de Google
CharacterGen : Génération efficace de personnages 3D à partir d'images uniques avec canonicalisation de la pose multi-vues
AnyText : Génération et édition de texte visuel multilingue
Moderniser les anciennes photos en utilisant plusieurs références via un transfert de style photoréaliste
YOLOv11 démystifié : un guide pratique pour la détection d'objets haute performance
SGDFuse : Modèle de diffusion guidé par SAM pour la fusion d'images infrarouges et visibles de haute fidélité
Le titre est vide. Veuillez fournir le titre à traduire.
Le titre est vide. Veuillez fournir le titre à traduire.
DeepSeek-Prover-V1.5 : Exploiter les retours des assistants de preuve pour l'apprentissage par renforcement et la recherche arborescente de Monte-Carlo
LLaVA-OneVision : Transfert facile des tâches visuelles
Le titre est vide. Veuillez fournir le titre à traduire.
Le titre est vide. Veuillez fournir le titre à traduire.
Le titre est vide. Veuillez fournir le titre à traduire.