Command Palette
Search for a command to run...
Wiki
Glossaire du Machine Learning : Explorez les définitions et explications des concepts clés de l'IA et du ML
Le pooling, également appelé pooling spatial, est une méthode utilisée pour extraire des caractéristiques dans les réseaux neuronaux convolutifs.
La vision par ordinateur est une science qui étudie comment faire « voir » les machines. Plus précisément, il s’agit d’utiliser des caméras et des ordinateurs pour remplacer les yeux humains afin d’identifier, de suivre et de mesurer des cibles, et d’utiliser des ordinateurs pour traiter des images en images plus adaptées à l’observation par l’œil humain ou à la transmission à des instruments de détection. Définition La vision par ordinateur est l’utilisation d’ordinateurs et de […]
La linguistique computationnelle est une discipline qui utilise des modèles mathématiques pour analyser et traiter les langues naturelles, et utilise des programmes sur ordinateur pour mettre en œuvre le processus d'analyse et de traitement, atteignant ainsi l'objectif d'utiliser des machines pour simuler une partie ou la totalité des capacités linguistiques d'une personne. Contenu de base La linguistique computationnelle peut être divisée en trois catégories suivantes selon la nature et la complexité de son travail : Édition automatique : […]
La décomposition propre est une méthode de décomposition d'une matrice en produit de matrices représentées par des valeurs propres et des vecteurs propres, mais seules les matrices diagonalisables peuvent effectuer une décomposition propre. La valeur propre peut être considérée comme le rapport d'échelle de la longueur du vecteur propre sous transformation linéaire. Si la valeur propre est positive, cela signifie que $latex v $ a été transformé linéairement […]
Définition de la rétropropagation La rétropropagation, abréviation de « rétropropagation d'erreur », est une méthode courante utilisée en conjonction avec des méthodes d'optimisation pour former des réseaux de neurones artificiels. Cette méthode calcule le gradient de la fonction de perte pour tous les poids du réseau. Ce gradient est renvoyé à la méthode d’optimisation pour mettre à jour les poids afin de minimiser la fonction de perte. […]
La rétropropagation dans le temps est un algorithme de rétropropagation appliqué aux réseaux neuronaux récurrents (RNN). BPTT peut être considéré comme l'algorithme de rétropropagation standard appliqué aux RNN, où chaque pas de temps représente une couche de calcul et ses paramètres sont partagés entre les couches de calcul. Parce que RNN à tous les pas de temps […]
Les apprenants de base généraux peuvent être composés de régression logistique, d'arbre de décision, de SVM, de réseau neuronal, de classificateur bayésien, de K-plus proche voisin, etc. Si les apprenants individuels sont générés à partir du même algorithme d'apprentissage à partir des données d'entraînement, on peut parler d'ensemble homogène, et les apprenants individuels dans ce cas sont également appelés apprenants de base ; l'ensemble peut également contenir différents […]
Définition Supposons que x est une variable aléatoire continue dont la distribution dépend de l'état de la catégorie et est exprimée sous la forme p(x|ω). Il s'agit de la fonction « probabilité conditionnelle de classe », c'est-à-dire la fonction de probabilité de x lorsque l'état de catégorie est ω. Fonction de probabilité conditionnelle de classe $latex P\left(X | w_{i}\ri […]
CART est une méthode d'apprentissage pour la distribution de probabilité conditionnelle de la variable aléatoire de sortie Y étant donné la variable aléatoire d'entrée X. Définition CART Supposons que l'arbre de décision est un arbre binaire, les valeurs des caractéristiques des nœuds internes sont « oui » et « non », la branche de gauche est la branche avec la valeur « oui » et la branche de droite est la branche avec la valeur « non ». ce[…]
Le déséquilibre des classes est un problème de classification binaire dans lequel les étiquettes des deux classes présentent un écart important dans leurs fréquences. Par exemple, dans un ensemble de données sur les maladies, 0,0001 échantillon a des étiquettes de classe positives et 0,9999 échantillon a des étiquettes de classe négatives, ce qui constitue un problème de déséquilibre de classification ; mais dans un […]
La forme fermée fait référence à certaines formules rigoureuses dans lesquelles n'importe quelle variable indépendante peut être utilisée pour trouver la variable dépendante, c'est-à-dire la solution au problème. Il s’agit d’une forme de solution qui comprend des fonctions de base telles que les fractions, les fonctions trigonométriques, les exponentielles, les logarithmes et même les séries infinies. La méthode utilisée pour trouver la solution pertinente est également appelée méthode analytique, qui est un calcul courant […]
L'analyse par clusters est une technique d'analyse statistique des données largement utilisée dans de nombreux domaines, notamment l'apprentissage automatique, l'exploration de données, la reconnaissance de formes, l'analyse d'images et la bioinformatique. Le clustering consiste à diviser des objets similaires en différents groupes ou sous-ensembles par classification statique, de sorte que les objets membres du même sous-ensemble aient [...]
L'ensemble de clustering est un algorithme permettant d'améliorer la précision, la stabilité et la robustesse des résultats de clustering. Un meilleur résultat peut être obtenu en intégrant plusieurs résultats de clustering de base. L'idée de base de cette méthode est de regrouper l'ensemble de données d'origine avec plusieurs clusters de base indépendants, puis d'utiliser une méthode d'ensemble pour le traiter et obtenir le meilleur […]
Un composant du décodeur dans un système de télécommande numérique. Il se compose d'un déclencheur bistable et d'un interrupteur de codage. Chaque bistable possède deux états, « 1 » et « 2 ». Lorsque n bistables sont mis en cascade, il existe 2n combinaisons possibles. Chaque combinaison est un groupe de codes binaires et les commutateurs de codage sont connectés en fonction du groupe de codes binaires. Le but de la matrice de codage est de convertir les instructions […]
L'une des conférences sur la théorie de l'apprentissage informatique, parrainée par l'ACM et organisée chaque année. La théorie de l'apprentissage informatique peut être considérée comme l'intersection de l'informatique théorique et de l'apprentissage automatique, elle est donc largement considérée comme une conférence liée à l'informatique. Site officiel : https://learningtheory.org/colt2019 […]
L'apprentissage compétitif est une méthode d'apprentissage des réseaux de neurones artificiels. Lorsque la structure du réseau est fixe, le processus d'apprentissage se réduit à la modification des droits de connexion, parmi lesquels l'apprentissage compétitif fait référence à la compétition entre toutes les unités du groupe d'unités du réseau pour le droit de répondre aux modèles de stimuli externes. Les droits de connexion de l'unité qui remporte la compétition changent dans une direction plus favorable à la compétition de ce modèle de stimulation.
Un apprenant composant est un type d’apprenant individuel généré sur la base d’un apprentissage d’ensemble. Lorsque des apprenants individuels sont générés par différents algorithmes d’apprentissage, on parle d’ensemble hétérogène, et ces apprenants individuels sont appelés apprenants composants.
L’explicabilité signifie que lorsque vous avez besoin de comprendre ou de résoudre un problème, vous pouvez obtenir les informations pertinentes dont vous avez besoin. Interprétabilité au niveau des données : permettre au réseau neuronal d'avoir une expression symbolique claire des connaissances internes pour correspondre au cadre de connaissances humaines, afin que les gens puissent diagnostiquer et modifier le réseau neuronal au niveau sémantique. L’apprentissage automatique peut résoudre […]
Les algorithmes de classification dans le domaine de l'apprentissage automatique divisent les attributs en discrets et continus, où les attributs discrets ont des valeurs dénombrables finies ou infinies qui peuvent ou non être représentées par des entiers, par exemple, les attributs hair_color, smoker, medical_test et drink_size ont tous des valeurs finies […]
La corrélation en cascade est définie comme une architecture d’apprentissage supervisé qui peut être utilisée pour créer une topologie de réseau multicouche minimale. Son avantage est que les utilisateurs n’ont pas à se soucier de la structure topologique du réseau et sa vitesse d’apprentissage est plus rapide que celle des algorithmes d’apprentissage traditionnels. Algorithme de corrélation L'algorithme de corrélation en cascade est mis en œuvre en commençant par un réseau minimal composé uniquement des entrées et des sorties […]
Définition : Dans des conditions déterminées, utiliser un étalon de référence pour attribuer des valeurs aux caractéristiques d'un instrument de mesure, y compris un matériau de référence, et déterminer son erreur d'indication. Objectif Déterminer l’erreur de l’indication et si elle se situe dans la plage de tolérance attendue ; Pour obtenir une valeur rapportée de l'écart par rapport à la valeur nominale et pour ajuster l'instrument de mesure ou corriger l'indication ; Pour donner à n’importe quel […]
Définition Pour l'équation différentielle $latex \frac{d \mathbf{x}}{dt}=\mathbf{f}(t, \mathbf{x}), \mathbf{x} \in \mathbb{R}^{n}$ , si $latex […]
L'amorçage est un échantillonnage uniforme avec remplacement à partir d'un ensemble d'apprentissage donné, c'est-à-dire que chaque fois qu'un échantillon est sélectionné, il est tout aussi susceptible d'être sélectionné à nouveau et ajouté à l'ensemble d'apprentissage. La méthode bootstrap a été proposée pour la première fois par Bradley Efron dans Annals of Statistics en 1979.
Pour un échantillon, la probabilité d'être collecté à chaque fois dans un échantillonnage aléatoire d'un ensemble d'apprentissage contenant m échantillons est de 1 m. La probabilité de ne pas être collecté est de 1 à 1 m. Si la probabilité que m échantillons ne soient pas collectés est (1−1m)m, alors lorsque m→∞, (1−1m)m→1/e≃0 […]
Le pooling, également appelé pooling spatial, est une méthode utilisée pour extraire des caractéristiques dans les réseaux neuronaux convolutifs.
La vision par ordinateur est une science qui étudie comment faire « voir » les machines. Plus précisément, il s’agit d’utiliser des caméras et des ordinateurs pour remplacer les yeux humains afin d’identifier, de suivre et de mesurer des cibles, et d’utiliser des ordinateurs pour traiter des images en images plus adaptées à l’observation par l’œil humain ou à la transmission à des instruments de détection. Définition La vision par ordinateur est l’utilisation d’ordinateurs et de […]
La linguistique computationnelle est une discipline qui utilise des modèles mathématiques pour analyser et traiter les langues naturelles, et utilise des programmes sur ordinateur pour mettre en œuvre le processus d'analyse et de traitement, atteignant ainsi l'objectif d'utiliser des machines pour simuler une partie ou la totalité des capacités linguistiques d'une personne. Contenu de base La linguistique computationnelle peut être divisée en trois catégories suivantes selon la nature et la complexité de son travail : Édition automatique : […]
La décomposition propre est une méthode de décomposition d'une matrice en produit de matrices représentées par des valeurs propres et des vecteurs propres, mais seules les matrices diagonalisables peuvent effectuer une décomposition propre. La valeur propre peut être considérée comme le rapport d'échelle de la longueur du vecteur propre sous transformation linéaire. Si la valeur propre est positive, cela signifie que $latex v $ a été transformé linéairement […]
Définition de la rétropropagation La rétropropagation, abréviation de « rétropropagation d'erreur », est une méthode courante utilisée en conjonction avec des méthodes d'optimisation pour former des réseaux de neurones artificiels. Cette méthode calcule le gradient de la fonction de perte pour tous les poids du réseau. Ce gradient est renvoyé à la méthode d’optimisation pour mettre à jour les poids afin de minimiser la fonction de perte. […]
La rétropropagation dans le temps est un algorithme de rétropropagation appliqué aux réseaux neuronaux récurrents (RNN). BPTT peut être considéré comme l'algorithme de rétropropagation standard appliqué aux RNN, où chaque pas de temps représente une couche de calcul et ses paramètres sont partagés entre les couches de calcul. Parce que RNN à tous les pas de temps […]
Les apprenants de base généraux peuvent être composés de régression logistique, d'arbre de décision, de SVM, de réseau neuronal, de classificateur bayésien, de K-plus proche voisin, etc. Si les apprenants individuels sont générés à partir du même algorithme d'apprentissage à partir des données d'entraînement, on peut parler d'ensemble homogène, et les apprenants individuels dans ce cas sont également appelés apprenants de base ; l'ensemble peut également contenir différents […]
Définition Supposons que x est une variable aléatoire continue dont la distribution dépend de l'état de la catégorie et est exprimée sous la forme p(x|ω). Il s'agit de la fonction « probabilité conditionnelle de classe », c'est-à-dire la fonction de probabilité de x lorsque l'état de catégorie est ω. Fonction de probabilité conditionnelle de classe $latex P\left(X | w_{i}\ri […]
CART est une méthode d'apprentissage pour la distribution de probabilité conditionnelle de la variable aléatoire de sortie Y étant donné la variable aléatoire d'entrée X. Définition CART Supposons que l'arbre de décision est un arbre binaire, les valeurs des caractéristiques des nœuds internes sont « oui » et « non », la branche de gauche est la branche avec la valeur « oui » et la branche de droite est la branche avec la valeur « non ». ce[…]
Le déséquilibre des classes est un problème de classification binaire dans lequel les étiquettes des deux classes présentent un écart important dans leurs fréquences. Par exemple, dans un ensemble de données sur les maladies, 0,0001 échantillon a des étiquettes de classe positives et 0,9999 échantillon a des étiquettes de classe négatives, ce qui constitue un problème de déséquilibre de classification ; mais dans un […]
La forme fermée fait référence à certaines formules rigoureuses dans lesquelles n'importe quelle variable indépendante peut être utilisée pour trouver la variable dépendante, c'est-à-dire la solution au problème. Il s’agit d’une forme de solution qui comprend des fonctions de base telles que les fractions, les fonctions trigonométriques, les exponentielles, les logarithmes et même les séries infinies. La méthode utilisée pour trouver la solution pertinente est également appelée méthode analytique, qui est un calcul courant […]
L'analyse par clusters est une technique d'analyse statistique des données largement utilisée dans de nombreux domaines, notamment l'apprentissage automatique, l'exploration de données, la reconnaissance de formes, l'analyse d'images et la bioinformatique. Le clustering consiste à diviser des objets similaires en différents groupes ou sous-ensembles par classification statique, de sorte que les objets membres du même sous-ensemble aient [...]
L'ensemble de clustering est un algorithme permettant d'améliorer la précision, la stabilité et la robustesse des résultats de clustering. Un meilleur résultat peut être obtenu en intégrant plusieurs résultats de clustering de base. L'idée de base de cette méthode est de regrouper l'ensemble de données d'origine avec plusieurs clusters de base indépendants, puis d'utiliser une méthode d'ensemble pour le traiter et obtenir le meilleur […]
Un composant du décodeur dans un système de télécommande numérique. Il se compose d'un déclencheur bistable et d'un interrupteur de codage. Chaque bistable possède deux états, « 1 » et « 2 ». Lorsque n bistables sont mis en cascade, il existe 2n combinaisons possibles. Chaque combinaison est un groupe de codes binaires et les commutateurs de codage sont connectés en fonction du groupe de codes binaires. Le but de la matrice de codage est de convertir les instructions […]
L'une des conférences sur la théorie de l'apprentissage informatique, parrainée par l'ACM et organisée chaque année. La théorie de l'apprentissage informatique peut être considérée comme l'intersection de l'informatique théorique et de l'apprentissage automatique, elle est donc largement considérée comme une conférence liée à l'informatique. Site officiel : https://learningtheory.org/colt2019 […]
L'apprentissage compétitif est une méthode d'apprentissage des réseaux de neurones artificiels. Lorsque la structure du réseau est fixe, le processus d'apprentissage se réduit à la modification des droits de connexion, parmi lesquels l'apprentissage compétitif fait référence à la compétition entre toutes les unités du groupe d'unités du réseau pour le droit de répondre aux modèles de stimuli externes. Les droits de connexion de l'unité qui remporte la compétition changent dans une direction plus favorable à la compétition de ce modèle de stimulation.
Un apprenant composant est un type d’apprenant individuel généré sur la base d’un apprentissage d’ensemble. Lorsque des apprenants individuels sont générés par différents algorithmes d’apprentissage, on parle d’ensemble hétérogène, et ces apprenants individuels sont appelés apprenants composants.
L’explicabilité signifie que lorsque vous avez besoin de comprendre ou de résoudre un problème, vous pouvez obtenir les informations pertinentes dont vous avez besoin. Interprétabilité au niveau des données : permettre au réseau neuronal d'avoir une expression symbolique claire des connaissances internes pour correspondre au cadre de connaissances humaines, afin que les gens puissent diagnostiquer et modifier le réseau neuronal au niveau sémantique. L’apprentissage automatique peut résoudre […]
Les algorithmes de classification dans le domaine de l'apprentissage automatique divisent les attributs en discrets et continus, où les attributs discrets ont des valeurs dénombrables finies ou infinies qui peuvent ou non être représentées par des entiers, par exemple, les attributs hair_color, smoker, medical_test et drink_size ont tous des valeurs finies […]
La corrélation en cascade est définie comme une architecture d’apprentissage supervisé qui peut être utilisée pour créer une topologie de réseau multicouche minimale. Son avantage est que les utilisateurs n’ont pas à se soucier de la structure topologique du réseau et sa vitesse d’apprentissage est plus rapide que celle des algorithmes d’apprentissage traditionnels. Algorithme de corrélation L'algorithme de corrélation en cascade est mis en œuvre en commençant par un réseau minimal composé uniquement des entrées et des sorties […]
Définition : Dans des conditions déterminées, utiliser un étalon de référence pour attribuer des valeurs aux caractéristiques d'un instrument de mesure, y compris un matériau de référence, et déterminer son erreur d'indication. Objectif Déterminer l’erreur de l’indication et si elle se situe dans la plage de tolérance attendue ; Pour obtenir une valeur rapportée de l'écart par rapport à la valeur nominale et pour ajuster l'instrument de mesure ou corriger l'indication ; Pour donner à n’importe quel […]
Définition Pour l'équation différentielle $latex \frac{d \mathbf{x}}{dt}=\mathbf{f}(t, \mathbf{x}), \mathbf{x} \in \mathbb{R}^{n}$ , si $latex […]
L'amorçage est un échantillonnage uniforme avec remplacement à partir d'un ensemble d'apprentissage donné, c'est-à-dire que chaque fois qu'un échantillon est sélectionné, il est tout aussi susceptible d'être sélectionné à nouveau et ajouté à l'ensemble d'apprentissage. La méthode bootstrap a été proposée pour la première fois par Bradley Efron dans Annals of Statistics en 1979.
Pour un échantillon, la probabilité d'être collecté à chaque fois dans un échantillonnage aléatoire d'un ensemble d'apprentissage contenant m échantillons est de 1 m. La probabilité de ne pas être collecté est de 1 à 1 m. Si la probabilité que m échantillons ne soient pas collectés est (1−1m)m, alors lorsque m→∞, (1−1m)m→1/e≃0 […]