Command Palette
Search for a command to run...
Wiki
Nous avons compilé des centaines d'entrées connexes pour vous aider à comprendre "l'intelligence artificielle"
L'attention causale (CATT) est un mécanisme d'attention innovant qui améliore l'interprétabilité et les performances du modèle en incorporant l'inférence causale, en particulier dans les tâches de vision-langage. Ce mécanisme a été découvert par des chercheurs de l'Université technologique de Nanyang et de l'Université Monash en Australie en 20 [...]
Les arbres de pensée généralisent l’approche populaire de l’enchaînement de pensées pour inciter à des modèles de langage et permettent l’exploration d’unités de texte cohérentes (pensées) comme étapes intermédiaires dans la résolution de problèmes.
L'architecture MoMa est une nouvelle architecture de mélange d'experts (MoE) prenant en compte les modalités, conçue pour la pré-formation de modèles de langage à modalités mixtes et à fusion précoce.
La minimisation des erreurs en plusieurs étapes (MEM) a été publiée en 2024 par l'Institut d'ingénierie de l'information de l'Académie chinoise des sciences, l'Université technologique de Nanyang, l'Université nationale de Singapour et l'Université Sun Yat-sen dans l'article « Multimodal Unlearnable E […]
La conjecture géométrique de Langlands est une version géométrique du programme de Langlands.
Le programme Langlands est un domaine de recherche très influent dans les mathématiques modernes. Il implique plusieurs branches des mathématiques, telles que la théorie des nombres, la géométrie algébrique et la théorie des représentations de groupe, et tente de révéler les liens profonds entre elles.
Un circuit intégré spécifique à une application (ASIC) est un circuit intégré conçu et fabriqué selon les exigences spécifiques des utilisateurs et les besoins d'un système électronique spécifique.
Le temps d'horloge murale est un terme utilisé pour mesurer le temps d'exécution d'un programme ou d'un processus. Il s'agit du temps réel écoulé entre le début et la fin de l'exécution du programme, y compris tous les types de temps d'attente et de blocage.
Le front de Pareto est un concept clé de l'optimisation multi-objectifs, qui fait référence à un ensemble de solutions permettant d'obtenir le meilleur compromis entre plusieurs objectifs.
Stride est un terme souvent utilisé dans le traitement d'images et les réseaux neuronaux convolutifs (CNN). Dans le contexte du traitement d'image, la foulée fait référence au nombre d'étapes que la fenêtre d'exploitation parcourt sur l'image lors de l'application d'une opération à l'image, telle que le recadrage, l'extraction de caractéristiques ou le filtrage. Par exemple, lors du recadrage d’une image, […]
Dynamic Prompts est une technologie d'invite qui permet d'ajuster dynamiquement les invites en fonction de tâches ou d'instances spécifiques dans le traitement du langage naturel (NLP) et d'autres applications d'intelligence artificielle. Cette technique peut améliorer considérablement les performances et l’adaptabilité du modèle. Dynamique […]
Simple Online and Realtime Tracking (SORT) est une méthode de suivi multi-cibles pratique qui se concentre sur des algorithmes simples et efficaces. Il a été présenté par des chercheurs de l'Université de technologie du Queensland et de l'Université de Sydney lors de la Conférence internationale IEEE 2016 sur le traitement d'images. […]
La relecture d'expériences prioritaires est une méthode d'apprentissage par renforcement qui rejoue les expériences à différentes fréquences en fonction de leur importance, améliorant ainsi l'efficacité de l'apprentissage.
La technologie CoT décompose les problèmes complexes en une série de réponses aux sous-problèmes étape par étape, guidant le modèle pour générer un processus de raisonnement détaillé, améliorant ainsi les performances du modèle sur des tâches complexes telles que le raisonnement arithmétique, le raisonnement de bon sens et le raisonnement symbolique.
Le réglage fin efficace des paramètres (PERT) est une méthode de réglage fin pour les grands modèles pré-entraînés qui réduit les coûts de calcul et de stockage en ajustant uniquement un petit sous-ensemble de paramètres du modèle tout en maintenant des performances comparables à un réglage fin des paramètres complets.
Dans le domaine de l’intelligence artificielle, un « modèle du monde » est un modèle qui permet de caractériser l’état de l’environnement ou du monde et de prédire les transitions entre les états. Ce modèle permet à l’agent d’apprendre dans un environnement simulé et de transférer les stratégies apprises au monde réel, améliorant ainsi l’efficacité de l’apprentissage et réduisant les risques. Jürgen S […]
L'apprentissage contrastif multimodal avec sélection d'exemples conjoints (JEST) vise à résoudre le problème de consommation d'énergie élevée lors de la formation de grands modèles de langage tels que ChatGPT.
Le réglage complet des paramètres est une technique d'optimisation de modèle dans l'apprentissage profond, particulièrement utilisée dans les scénarios d'apprentissage par transfert ou d'adaptation de domaine. Il s’agit d’affiner tous les paramètres d’un modèle pré-entraîné pour l’adapter à une tâche ou à un ensemble de données spécifique.
Le réseau d'occupation joue un rôle important dans les tâches de perception de la conduite autonome. Il s’agit d’un modèle de réseau qui se concentre sur la géométrie plutôt que sur la sémantique. Il peut aider les systèmes de conduite autonome à mieux percevoir l’espace libre et constitue une technologie clé pour améliorer les capacités de perception et former une boucle fermée.
L'idée principale du réalignement pendant le décodage est d'ajuster dynamiquement l'alignement du modèle pendant le processus de décodage sans recycler le modèle, économisant ainsi des ressources informatiques et améliorant l'efficacité de la recherche.
La technologie d'éclaboussure gaussienne tridimensionnelle est une technologie d'infographie avancée, qui a des applications importantes dans le rendu de nuages de points, la visualisation de données de volume et la reconstruction de volume. Cette technologie permet d'obtenir des rendus de meilleure qualité en convertissant des points de données discrets, ou voxels, en une représentation de surface ou de volume continue.
Le test en mode ombre est une méthode de test utilisée dans le domaine de la conduite autonome. Il est principalement utilisé pour vérifier et évaluer les algorithmes de conduite autonome dans des environnements de trafic réels tout en garantissant qu'il n'interfère pas avec le conducteur et le trafic environnant.
Le fléau de la rareté est un problème scientifique clé dans le domaine de la conduite autonome. Cela fait référence au fait que dans les environnements de conduite réels, la probabilité d'événements critiques pour la sécurité est extrêmement faible, ce qui fait que ces événements sont extrêmement rares dans les données de conduite, ce qui rend difficile pour les modèles d'apprentissage en profondeur d'apprendre les caractéristiques de ces événements.
La perte de diffusion est une fonction de perte liée au modèle de diffusion, qui est utilisée pendant le processus de formation pour guider le modèle afin d'apprendre à supprimer progressivement le bruit et à restaurer la structure d'origine des données.