Command Palette
Search for a command to run...
Wiki
Machine Learning Glossary: Explore definitions and explanations of key AI and ML concepts
ReAct propose un paradigme général qui combine les avancées du raisonnement et de l’action pour permettre aux modèles linguistiques de résoudre une variété de tâches de raisonnement et de prise de décision linguistiques.
Pre-training Once est un cadre de formation auto-supervisé à trois branches qui introduit des branches d'étudiants élastiques et échantillonne aléatoirement des sous-réseaux pour la formation à chaque étape de pré-formation.
FlexAttention est un mécanisme d'attention flexible conçu pour améliorer l'efficacité des modèles de vision-langage haute résolution.
FlashAttention est un algorithme d'attention efficace et respectueux de la mémoire.
L'attention causale (CATT) est un mécanisme d'attention innovant qui améliore l'interprétabilité et les performances du modèle en incorporant l'inférence causale, en particulier dans les tâches de vision-langage. Ce mécanisme a été découvert par des chercheurs de l'Université technologique de Nanyang et de l'Université Monash en Australie en 20 [...]
Les arbres de pensée généralisent l’approche populaire de l’enchaînement de pensées pour inciter à des modèles de langage et permettent l’exploration d’unités de texte cohérentes (pensées) comme étapes intermédiaires dans la résolution de problèmes.
L'architecture MoMa est une nouvelle architecture de mélange d'experts (MoE) prenant en compte les modalités, conçue pour la pré-formation de modèles de langage à modalités mixtes et à fusion précoce.
La minimisation des erreurs en plusieurs étapes (MEM) a été publiée en 2024 par l'Institut d'ingénierie de l'information de l'Académie chinoise des sciences, l'Université technologique de Nanyang, l'Université nationale de Singapour et l'Université Sun Yat-sen dans l'article « Multimodal Unlearnable E […]
La conjecture géométrique de Langlands est une version géométrique du programme de Langlands.
Le programme Langlands est un domaine de recherche très influent dans les mathématiques modernes. Il implique plusieurs branches des mathématiques, telles que la théorie des nombres, la géométrie algébrique et la théorie des représentations de groupe, et tente de révéler les liens profonds entre elles.
Un circuit intégré spécifique à une application (ASIC) est un circuit intégré conçu et fabriqué selon les exigences spécifiques des utilisateurs et les besoins d'un système électronique spécifique.
Le temps d'horloge murale est un terme utilisé pour mesurer le temps d'exécution d'un programme ou d'un processus. Il s'agit du temps réel écoulé entre le début et la fin de l'exécution du programme, y compris tous les types de temps d'attente et de blocage.
Le front de Pareto est un concept clé de l'optimisation multi-objectifs, qui fait référence à un ensemble de solutions permettant d'obtenir le meilleur compromis entre plusieurs objectifs.
Stride est un terme souvent utilisé dans le traitement d'images et les réseaux neuronaux convolutifs (CNN). Dans le contexte du traitement d'image, la foulée fait référence au nombre d'étapes que la fenêtre d'exploitation parcourt sur l'image lors de l'application d'une opération à l'image, telle que le recadrage, l'extraction de caractéristiques ou le filtrage. Par exemple, lors du recadrage d’une image, […]
Dynamic Prompts est une technologie d'invite qui permet d'ajuster dynamiquement les invites en fonction de tâches ou d'instances spécifiques dans le traitement du langage naturel (NLP) et d'autres applications d'intelligence artificielle. Cette technique peut améliorer considérablement les performances et l’adaptabilité du modèle. Dynamique […]
Simple Online and Realtime Tracking (SORT) est une méthode de suivi multi-cibles pratique qui se concentre sur des algorithmes simples et efficaces. Il a été présenté par des chercheurs de l'Université de technologie du Queensland et de l'Université de Sydney lors de la Conférence internationale IEEE 2016 sur le traitement d'images. […]
La relecture d'expériences prioritaires est une méthode d'apprentissage par renforcement qui rejoue les expériences à différentes fréquences en fonction de leur importance, améliorant ainsi l'efficacité de l'apprentissage.
La technologie CoT décompose les problèmes complexes en une série de réponses aux sous-problèmes étape par étape, guidant le modèle pour générer un processus de raisonnement détaillé, améliorant ainsi les performances du modèle sur des tâches complexes telles que le raisonnement arithmétique, le raisonnement de bon sens et le raisonnement symbolique.
Le réglage fin efficace des paramètres (PERT) est une méthode de réglage fin pour les grands modèles pré-entraînés qui réduit les coûts de calcul et de stockage en ajustant uniquement un petit sous-ensemble de paramètres du modèle tout en maintenant des performances comparables à un réglage fin des paramètres complets.
Dans le domaine de l’intelligence artificielle, un « modèle du monde » est un modèle qui permet de caractériser l’état de l’environnement ou du monde et de prédire les transitions entre les états. Ce modèle permet à l’agent d’apprendre dans un environnement simulé et de transférer les stratégies apprises au monde réel, améliorant ainsi l’efficacité de l’apprentissage et réduisant les risques. Jürgen S […]
L'apprentissage contrastif multimodal avec sélection d'exemples conjoints (JEST) vise à résoudre le problème de consommation d'énergie élevée lors de la formation de grands modèles de langage tels que ChatGPT.
Le réglage complet des paramètres est une technique d'optimisation de modèle dans l'apprentissage profond, particulièrement utilisée dans les scénarios d'apprentissage par transfert ou d'adaptation de domaine. Il s’agit d’affiner tous les paramètres d’un modèle pré-entraîné pour l’adapter à une tâche ou à un ensemble de données spécifique.
Le réseau d'occupation joue un rôle important dans les tâches de perception de la conduite autonome. Il s’agit d’un modèle de réseau qui se concentre sur la géométrie plutôt que sur la sémantique. Il peut aider les systèmes de conduite autonome à mieux percevoir l’espace libre et constitue une technologie clé pour améliorer les capacités de perception et former une boucle fermée.
L'idée principale du réalignement pendant le décodage est d'ajuster dynamiquement l'alignement du modèle pendant le processus de décodage sans recycler le modèle, économisant ainsi des ressources informatiques et améliorant l'efficacité de la recherche.
ReAct propose un paradigme général qui combine les avancées du raisonnement et de l’action pour permettre aux modèles linguistiques de résoudre une variété de tâches de raisonnement et de prise de décision linguistiques.
Pre-training Once est un cadre de formation auto-supervisé à trois branches qui introduit des branches d'étudiants élastiques et échantillonne aléatoirement des sous-réseaux pour la formation à chaque étape de pré-formation.
FlexAttention est un mécanisme d'attention flexible conçu pour améliorer l'efficacité des modèles de vision-langage haute résolution.
FlashAttention est un algorithme d'attention efficace et respectueux de la mémoire.
L'attention causale (CATT) est un mécanisme d'attention innovant qui améliore l'interprétabilité et les performances du modèle en incorporant l'inférence causale, en particulier dans les tâches de vision-langage. Ce mécanisme a été découvert par des chercheurs de l'Université technologique de Nanyang et de l'Université Monash en Australie en 20 [...]
Les arbres de pensée généralisent l’approche populaire de l’enchaînement de pensées pour inciter à des modèles de langage et permettent l’exploration d’unités de texte cohérentes (pensées) comme étapes intermédiaires dans la résolution de problèmes.
L'architecture MoMa est une nouvelle architecture de mélange d'experts (MoE) prenant en compte les modalités, conçue pour la pré-formation de modèles de langage à modalités mixtes et à fusion précoce.
La minimisation des erreurs en plusieurs étapes (MEM) a été publiée en 2024 par l'Institut d'ingénierie de l'information de l'Académie chinoise des sciences, l'Université technologique de Nanyang, l'Université nationale de Singapour et l'Université Sun Yat-sen dans l'article « Multimodal Unlearnable E […]
La conjecture géométrique de Langlands est une version géométrique du programme de Langlands.
Le programme Langlands est un domaine de recherche très influent dans les mathématiques modernes. Il implique plusieurs branches des mathématiques, telles que la théorie des nombres, la géométrie algébrique et la théorie des représentations de groupe, et tente de révéler les liens profonds entre elles.
Un circuit intégré spécifique à une application (ASIC) est un circuit intégré conçu et fabriqué selon les exigences spécifiques des utilisateurs et les besoins d'un système électronique spécifique.
Le temps d'horloge murale est un terme utilisé pour mesurer le temps d'exécution d'un programme ou d'un processus. Il s'agit du temps réel écoulé entre le début et la fin de l'exécution du programme, y compris tous les types de temps d'attente et de blocage.
Le front de Pareto est un concept clé de l'optimisation multi-objectifs, qui fait référence à un ensemble de solutions permettant d'obtenir le meilleur compromis entre plusieurs objectifs.
Stride est un terme souvent utilisé dans le traitement d'images et les réseaux neuronaux convolutifs (CNN). Dans le contexte du traitement d'image, la foulée fait référence au nombre d'étapes que la fenêtre d'exploitation parcourt sur l'image lors de l'application d'une opération à l'image, telle que le recadrage, l'extraction de caractéristiques ou le filtrage. Par exemple, lors du recadrage d’une image, […]
Dynamic Prompts est une technologie d'invite qui permet d'ajuster dynamiquement les invites en fonction de tâches ou d'instances spécifiques dans le traitement du langage naturel (NLP) et d'autres applications d'intelligence artificielle. Cette technique peut améliorer considérablement les performances et l’adaptabilité du modèle. Dynamique […]
Simple Online and Realtime Tracking (SORT) est une méthode de suivi multi-cibles pratique qui se concentre sur des algorithmes simples et efficaces. Il a été présenté par des chercheurs de l'Université de technologie du Queensland et de l'Université de Sydney lors de la Conférence internationale IEEE 2016 sur le traitement d'images. […]
La relecture d'expériences prioritaires est une méthode d'apprentissage par renforcement qui rejoue les expériences à différentes fréquences en fonction de leur importance, améliorant ainsi l'efficacité de l'apprentissage.
La technologie CoT décompose les problèmes complexes en une série de réponses aux sous-problèmes étape par étape, guidant le modèle pour générer un processus de raisonnement détaillé, améliorant ainsi les performances du modèle sur des tâches complexes telles que le raisonnement arithmétique, le raisonnement de bon sens et le raisonnement symbolique.
Le réglage fin efficace des paramètres (PERT) est une méthode de réglage fin pour les grands modèles pré-entraînés qui réduit les coûts de calcul et de stockage en ajustant uniquement un petit sous-ensemble de paramètres du modèle tout en maintenant des performances comparables à un réglage fin des paramètres complets.
Dans le domaine de l’intelligence artificielle, un « modèle du monde » est un modèle qui permet de caractériser l’état de l’environnement ou du monde et de prédire les transitions entre les états. Ce modèle permet à l’agent d’apprendre dans un environnement simulé et de transférer les stratégies apprises au monde réel, améliorant ainsi l’efficacité de l’apprentissage et réduisant les risques. Jürgen S […]
L'apprentissage contrastif multimodal avec sélection d'exemples conjoints (JEST) vise à résoudre le problème de consommation d'énergie élevée lors de la formation de grands modèles de langage tels que ChatGPT.
Le réglage complet des paramètres est une technique d'optimisation de modèle dans l'apprentissage profond, particulièrement utilisée dans les scénarios d'apprentissage par transfert ou d'adaptation de domaine. Il s’agit d’affiner tous les paramètres d’un modèle pré-entraîné pour l’adapter à une tâche ou à un ensemble de données spécifique.
Le réseau d'occupation joue un rôle important dans les tâches de perception de la conduite autonome. Il s’agit d’un modèle de réseau qui se concentre sur la géométrie plutôt que sur la sémantique. Il peut aider les systèmes de conduite autonome à mieux percevoir l’espace libre et constitue une technologie clé pour améliorer les capacités de perception et former une boucle fermée.
L'idée principale du réalignement pendant le décodage est d'ajuster dynamiquement l'alignement du modèle pendant le processus de décodage sans recycler le modèle, économisant ainsi des ressources informatiques et améliorant l'efficacité de la recherche.