Command Palette
Search for a command to run...
Wiki
Nous avons compilé des centaines d'entrées connexes pour vous aider à comprendre "l'intelligence artificielle"
D-MoLE est une nouvelle méthode conçue pour le réglage fin continu des instructions multimodales
M+ améliore considérablement la capacité à conserver des informations à long terme
AI Flow améliore l'intelligence, la réactivité et l'accessibilité des services d'IA
SparseMM priorise et préserve la sémantique visuelle lors du décodage
MAS est un système informatique composé de plusieurs agents interagissant dans un environnement.
CTC est une fonction de perte et une méthode de modélisation largement utilisées dans les tâches d'apprentissage séquence à séquence.
L'ensemble de connaissances partagées de l'arbre de recherche est un algorithme de recherche proposé par Google DeepMind
VeBrain permet aux robots de « voir, penser, agir »
BCM joue un rôle important dans la promotion du développement de la technologie de détection des défauts industriels.
L’oubli des machines répond à des besoins tels que la protection de la vie privée, les exigences légales ou la protection des droits d’auteur.
La greffe est un moyen simple de modifier un transformateur de diffusion pré-entraîné (DiT).
PENCIL vise à permettre aux grands modèles d'effacer dynamiquement les résultats intermédiaires inutiles pendant le processus de génération jusqu'à ce que la réponse finale soit obtenue.
RAP est un plugin de perception d'image haute résolution basé sur la technologie RAG qui ne nécessite pas de formation.
Le taux d’erreur de mots est un indicateur important pour évaluer les performances des systèmes de reconnaissance vocale ou de correspondance de texte.
La similarité entre locuteurs vise à mesurer si deux échantillons de discours proviennent du même locuteur ou à quel point les deux échantillons sont similaires.
L'échantillonnage guidé est une technique utilisée pour améliorer la qualité des échantillons dans les modèles génératifs, visant à améliorer la contrôlabilité des modèles génératifs.
L'auto-réflexion superficielle vise à optimiser rapidement les performances de la tâche ou du comportement actuel en apportant des ajustements locaux au modèle grâce à un retour d'information immédiat.
La visualisation de la pensée multimodale vise à fournir un affichage plus intuitif et plus complet des processus de réflexion, de prise de décision et de traitement de l'information grâce au travail collaboratif de plusieurs modalités différentes.
Sparse autoencoder est un algorithme d'apprentissage automatique non supervisé.
Le mélange continu de concepts vise à générer de nouveaux échantillons de données en mélangeant différents concepts ou fonctionnalités pour étendre les capacités d'apprentissage et de raisonnement du modèle.
Le raisonnement arithmétique déductif de base de données vise à déduire et à calculer les données de la base de données au moyen de règles d'inférence et d'opérations mathématiques.
Les méthodes d'alignement des préférences au niveau des jetons visent à réduire le problème d'hallucination dans les grands modèles de langage visuel (LVLM).
La mise à l'échelle du temps d'inférence est une méthode permettant d'améliorer les performances des grands modèles de langage (LLM) en augmentant les ressources de calcul pendant la phase d'inférence.
La perception lente vise à obtenir une perception détaillée des figures géométriques en divisant le processus de perception, afin d'améliorer les performances des grands modèles multimodaux dans les tâches de raisonnement visuel.