Command Palette
Search for a command to run...
Wiki
Glossaire du Machine Learning : Explorez les définitions et explications des concepts clés de l'IA et du ML
L'unité récurrente fermée (GRU) est une variante du réseau neuronal récurrent (RNN) proposé par Cho et al. en 2014. L'article connexe est « Évaluation empirique de Gate […]
AlexNet est un réseau neuronal convolutif profond (CNN) proposé par Alex Krizhevsky, Ilya Sutskever et Geoffrey Hinton en 2012 et utilisé dans le concours de classification d'images ImageNet cette année-là.
CART Decision Tree est un algorithme d'arbre de décision qui peut être utilisé pour les tâches de classification et de régression.
Gradient Boosting est un algorithme d'apprentissage d'ensemble qui construit un modèle de prédiction fort en combinant plusieurs modèles de prédiction faibles (généralement des arbres de décision).
LeNet-5 est un travail pionnier dans le domaine de l'apprentissage profond et des réseaux de neurones convolutifs, qui a jeté les bases de nombreux concepts clés de l'apprentissage profond moderne, tels que les couches convolutives, les couches de pooling et les couches entièrement connectées.
Les questions de qualification se concentrent sur la manière de déterminer toutes les conditions ou facteurs nécessaires pour qu’une action ou un événement soit exécuté avec succès dans un environnement en évolution.
ReAct propose un paradigme général qui combine les avancées du raisonnement et de l’action pour permettre aux modèles linguistiques de résoudre une variété de tâches de raisonnement et de prise de décision linguistiques.
Pre-training Once est un cadre de formation auto-supervisé à trois branches qui introduit des branches d'étudiants élastiques et échantillonne aléatoirement des sous-réseaux pour la formation à chaque étape de pré-formation.
FlexAttention est un mécanisme d'attention flexible conçu pour améliorer l'efficacité des modèles de vision-langage haute résolution.
FlashAttention est un algorithme d'attention efficace et respectueux de la mémoire.
L'attention causale (CATT) est un mécanisme d'attention innovant qui améliore l'interprétabilité et les performances du modèle en incorporant l'inférence causale, en particulier dans les tâches de vision-langage. Ce mécanisme a été découvert par des chercheurs de l'Université technologique de Nanyang et de l'Université Monash en Australie en 20 [...]
Les arbres de pensée généralisent l’approche populaire de l’enchaînement de pensées pour inciter à des modèles de langage et permettent l’exploration d’unités de texte cohérentes (pensées) comme étapes intermédiaires dans la résolution de problèmes.
L'architecture MoMa est une nouvelle architecture de mélange d'experts (MoE) prenant en compte les modalités, conçue pour la pré-formation de modèles de langage à modalités mixtes et à fusion précoce.
La minimisation des erreurs en plusieurs étapes (MEM) a été publiée en 2024 par l'Institut d'ingénierie de l'information de l'Académie chinoise des sciences, l'Université technologique de Nanyang, l'Université nationale de Singapour et l'Université Sun Yat-sen dans l'article « Multimodal Unlearnable E […]
La conjecture géométrique de Langlands est une version géométrique du programme de Langlands.
Le programme Langlands est un domaine de recherche très influent dans les mathématiques modernes. Il implique plusieurs branches des mathématiques, telles que la théorie des nombres, la géométrie algébrique et la théorie des représentations de groupe, et tente de révéler les liens profonds entre elles.
Un circuit intégré spécifique à une application (ASIC) est un circuit intégré conçu et fabriqué selon les exigences spécifiques des utilisateurs et les besoins d'un système électronique spécifique.
Le temps d'horloge murale est un terme utilisé pour mesurer le temps d'exécution d'un programme ou d'un processus. Il s'agit du temps réel écoulé entre le début et la fin de l'exécution du programme, y compris tous les types de temps d'attente et de blocage.
Le front de Pareto est un concept clé de l'optimisation multi-objectifs, qui fait référence à un ensemble de solutions permettant d'obtenir le meilleur compromis entre plusieurs objectifs.
Stride est un terme souvent utilisé dans le traitement d'images et les réseaux neuronaux convolutifs (CNN). Dans le contexte du traitement d'image, la foulée fait référence au nombre d'étapes que la fenêtre d'exploitation parcourt sur l'image lors de l'application d'une opération à l'image, telle que le recadrage, l'extraction de caractéristiques ou le filtrage. Par exemple, lors du recadrage d’une image, […]
Dynamic Prompts est une technologie d'invite qui permet d'ajuster dynamiquement les invites en fonction de tâches ou d'instances spécifiques dans le traitement du langage naturel (NLP) et d'autres applications d'intelligence artificielle. Cette technique peut améliorer considérablement les performances et l’adaptabilité du modèle. Dynamique […]
Simple Online and Realtime Tracking (SORT) est une méthode de suivi multi-cibles pratique qui se concentre sur des algorithmes simples et efficaces. Il a été présenté par des chercheurs de l'Université de technologie du Queensland et de l'Université de Sydney lors de la Conférence internationale IEEE 2016 sur le traitement d'images. […]
La relecture d'expériences prioritaires est une méthode d'apprentissage par renforcement qui rejoue les expériences à différentes fréquences en fonction de leur importance, améliorant ainsi l'efficacité de l'apprentissage.
La technologie CoT décompose les problèmes complexes en une série de réponses aux sous-problèmes étape par étape, guidant le modèle pour générer un processus de raisonnement détaillé, améliorant ainsi les performances du modèle sur des tâches complexes telles que le raisonnement arithmétique, le raisonnement de bon sens et le raisonnement symbolique.
L'unité récurrente fermée (GRU) est une variante du réseau neuronal récurrent (RNN) proposé par Cho et al. en 2014. L'article connexe est « Évaluation empirique de Gate […]
AlexNet est un réseau neuronal convolutif profond (CNN) proposé par Alex Krizhevsky, Ilya Sutskever et Geoffrey Hinton en 2012 et utilisé dans le concours de classification d'images ImageNet cette année-là.
CART Decision Tree est un algorithme d'arbre de décision qui peut être utilisé pour les tâches de classification et de régression.
Gradient Boosting est un algorithme d'apprentissage d'ensemble qui construit un modèle de prédiction fort en combinant plusieurs modèles de prédiction faibles (généralement des arbres de décision).
LeNet-5 est un travail pionnier dans le domaine de l'apprentissage profond et des réseaux de neurones convolutifs, qui a jeté les bases de nombreux concepts clés de l'apprentissage profond moderne, tels que les couches convolutives, les couches de pooling et les couches entièrement connectées.
Les questions de qualification se concentrent sur la manière de déterminer toutes les conditions ou facteurs nécessaires pour qu’une action ou un événement soit exécuté avec succès dans un environnement en évolution.
ReAct propose un paradigme général qui combine les avancées du raisonnement et de l’action pour permettre aux modèles linguistiques de résoudre une variété de tâches de raisonnement et de prise de décision linguistiques.
Pre-training Once est un cadre de formation auto-supervisé à trois branches qui introduit des branches d'étudiants élastiques et échantillonne aléatoirement des sous-réseaux pour la formation à chaque étape de pré-formation.
FlexAttention est un mécanisme d'attention flexible conçu pour améliorer l'efficacité des modèles de vision-langage haute résolution.
FlashAttention est un algorithme d'attention efficace et respectueux de la mémoire.
L'attention causale (CATT) est un mécanisme d'attention innovant qui améliore l'interprétabilité et les performances du modèle en incorporant l'inférence causale, en particulier dans les tâches de vision-langage. Ce mécanisme a été découvert par des chercheurs de l'Université technologique de Nanyang et de l'Université Monash en Australie en 20 [...]
Les arbres de pensée généralisent l’approche populaire de l’enchaînement de pensées pour inciter à des modèles de langage et permettent l’exploration d’unités de texte cohérentes (pensées) comme étapes intermédiaires dans la résolution de problèmes.
L'architecture MoMa est une nouvelle architecture de mélange d'experts (MoE) prenant en compte les modalités, conçue pour la pré-formation de modèles de langage à modalités mixtes et à fusion précoce.
La minimisation des erreurs en plusieurs étapes (MEM) a été publiée en 2024 par l'Institut d'ingénierie de l'information de l'Académie chinoise des sciences, l'Université technologique de Nanyang, l'Université nationale de Singapour et l'Université Sun Yat-sen dans l'article « Multimodal Unlearnable E […]
La conjecture géométrique de Langlands est une version géométrique du programme de Langlands.
Le programme Langlands est un domaine de recherche très influent dans les mathématiques modernes. Il implique plusieurs branches des mathématiques, telles que la théorie des nombres, la géométrie algébrique et la théorie des représentations de groupe, et tente de révéler les liens profonds entre elles.
Un circuit intégré spécifique à une application (ASIC) est un circuit intégré conçu et fabriqué selon les exigences spécifiques des utilisateurs et les besoins d'un système électronique spécifique.
Le temps d'horloge murale est un terme utilisé pour mesurer le temps d'exécution d'un programme ou d'un processus. Il s'agit du temps réel écoulé entre le début et la fin de l'exécution du programme, y compris tous les types de temps d'attente et de blocage.
Le front de Pareto est un concept clé de l'optimisation multi-objectifs, qui fait référence à un ensemble de solutions permettant d'obtenir le meilleur compromis entre plusieurs objectifs.
Stride est un terme souvent utilisé dans le traitement d'images et les réseaux neuronaux convolutifs (CNN). Dans le contexte du traitement d'image, la foulée fait référence au nombre d'étapes que la fenêtre d'exploitation parcourt sur l'image lors de l'application d'une opération à l'image, telle que le recadrage, l'extraction de caractéristiques ou le filtrage. Par exemple, lors du recadrage d’une image, […]
Dynamic Prompts est une technologie d'invite qui permet d'ajuster dynamiquement les invites en fonction de tâches ou d'instances spécifiques dans le traitement du langage naturel (NLP) et d'autres applications d'intelligence artificielle. Cette technique peut améliorer considérablement les performances et l’adaptabilité du modèle. Dynamique […]
Simple Online and Realtime Tracking (SORT) est une méthode de suivi multi-cibles pratique qui se concentre sur des algorithmes simples et efficaces. Il a été présenté par des chercheurs de l'Université de technologie du Queensland et de l'Université de Sydney lors de la Conférence internationale IEEE 2016 sur le traitement d'images. […]
La relecture d'expériences prioritaires est une méthode d'apprentissage par renforcement qui rejoue les expériences à différentes fréquences en fonction de leur importance, améliorant ainsi l'efficacité de l'apprentissage.
La technologie CoT décompose les problèmes complexes en une série de réponses aux sous-problèmes étape par étape, guidant le modèle pour générer un processus de raisonnement détaillé, améliorant ainsi les performances du modèle sur des tâches complexes telles que le raisonnement arithmétique, le raisonnement de bon sens et le raisonnement symbolique.