HyperAI

Machine Learning Glossary: Definitionen und Erklärungen wichtiger KI- und ML-Konzepte erkunden

Boltzmann-Maschine

Eine Boltzmann-Maschine ist eine Art zufälliges neuronales Netzwerk und rekurrentes neuronales Netzwerk, das 1985 von Geoffrey Hinton und Terry Sejnowski erfunden wurde. Eine Boltzmann-Maschine kann als ein zufälliger Prozess betrachtet werden, der die entsprechenden […] generiert.

vor 6 Jahren

Zweiteilige Partition

Definition: Eine Bisektionsmethode ist ein Algorithmus, dessen Eingabe eine geordnete Liste von Elementen ist. Wenn das gesuchte Element in der Liste enthalten ist, gibt die binäre Suche seine Position zurück. andernfalls wird null zurückgegeben. Grundidee: Diese Methode eignet sich, wenn die Datenmenge groß ist. Bei der binären Suche müssen die Daten sortiert werden. Gehen Sie davon aus, dass die Daten in aufsteigender Reihenfolge sind […]

vor 6 Jahren

Binomialtest

Definition: Der Binomialtest vergleicht die beobachteten Häufigkeiten der beiden Kategorien einer dichotomen Variablen mit den erwarteten Häufigkeiten unter einer Binomialverteilung mit einem angegebenen Wahrscheinlichkeitsparameter. Standardmäßig beträgt der Wahrscheinlichkeitsparameter für beide Gruppen 0,5. Beispiel: Eine Münze wird geworfen und die Wahrscheinlichkeit für Kopf beträgt 1/2. Unter dieser Annahme wird eine Münze 40 Mal geworfen […]

vor 6 Jahren

Binäre Klassifizierung

Gibt an, dass es bei der Klassifizierungsaufgabe nur zwei Kategorien gibt. Beispielsweise möchten wir feststellen, ob ein Bild eine Katze darstellt oder nicht. Das heißt, trainieren Sie einen Klassifikator, geben Sie ein Bild ein, das durch den Merkmalsvektor x dargestellt wird, und geben Sie aus, ob es sich um eine Katze handelt, dargestellt durch y = 0 oder 1; Bei der Zwei-Klassen-Klassifizierung wird davon ausgegangen, dass jede Probe mit genau einem Label 0 […] versehen ist.

vor 6 Jahren

Bidirektionales Langzeit-Kurzzeitgedächtnis/Bi-LSTM

Definition: Tiefe neuronale Netzwerke haben in vielen Bereichen wie Spracherkennung, Bildverarbeitung und Verarbeitung natürlicher Sprache hervorragende Ergebnisse gezeigt. LSTM kann als Variante von RNN im Vergleich zu RNN langfristige Abhängigkeiten in Daten lernen. Im Jahr 2005 schlug Graves vor, LSTM mit […] zu kombinieren.

vor 6 Jahren

Bias-Varianz-Dilemma

Das Bias-Varianz-Dilemma bedeutet, dass es unmöglich ist, Bias und Varianz gleichzeitig zu reduzieren, und dass man nur ein Gleichgewicht zwischen beiden erreichen kann. Wenn Sie im Modell die Abweichung verringern möchten, erhöhen Sie die Komplexität des Modells, um eine Unteranpassung zu verhindern. Gleichzeitig dürfen Sie das Modell jedoch nicht zu komplex gestalten, da dies die Varianz erhöhen und zu einer Überanpassung führen würde. Daher müssen wir ein Gleichgewicht in der Komplexität des Modells finden.

vor 6 Jahren

Bias-Varianz-Zerlegung

„Bias-Varianz-Zerlegung“ ist ein Tool, das die Generalisierungsleistung von Lernalgorithmen aus der Perspektive von Bias und Varianz erklärt. Die spezifische Definition lautet wie folgt: Angenommen, es gibt K Datensätze, von denen jeder unabhängig aus einer Verteilung p(t,x) extrahiert wird (t stellt die vorherzusagende Variable dar und x stellt die Merkmalsvariable dar). In verschiedenen […]

vor 6 Jahren

Voreingenommenheit

Definition: Der Unterschied zwischen der erwarteten Ausgabe und der wahren Bezeichnung wird als Bias bezeichnet. Die folgende Abbildung kann den Zusammenhang zwischen Bias und Varianz gut veranschaulichen:

vor 6 Jahren

Streumatrix Zwischen Den Klassen

Die Streumatrix zwischen den Klassen wird verwendet, um die Streuung jedes Stichprobenpunkts um den Mittelwert darzustellen. Mathematische Definition

vor 6 Jahren

Bayes-Netzwerk

Definition: Das Bayes-Netzwerk ist eines der effektivsten theoretischen Modelle im Bereich des Ausdrucks und der Schlussfolgerung unsicheren Wissens. Ein Bayes-Netzwerk besteht aus Knoten, die Variablen darstellen, und gerichteten Kanten, die diese Knoten verbinden. Knoten stellen Zufallsvariablen dar. Die gerichteten Kanten zwischen Knoten stellen die Beziehungen zwischen Knoten dar. Die Stärke der Beziehung wird mithilfe der bedingten Wahrscheinlichkeit ausgedrückt. Es gibt keinen übergeordneten Knoten […]

vor 6 Jahren

Bayesianische Entscheidungstheorie

Grundlegende Konzepte Die Bayes'sche Entscheidungstheorie ist eine grundlegende Methode zur Entscheidungsfindung mit statistischen Modellen. Die Grundidee ist: Der Ausdruck des Parameters „bedingte Wahrscheinlichkeitsdichte“ und die Vorwahrscheinlichkeit einer bekannten Klasse werden mithilfe der Bayes-Formel in eine Nachwahrscheinlichkeit umgewandelt. Die Entscheidungsklassifizierung erfolgt auf Grundlage der Größe der Posterior-Wahrscheinlichkeit. Zugehörige Formel: Seien D1, D2, ..., Dn Proben […]

vor 6 Jahren

Bayes Optimaler Klassifikator

Um das Gesamtrisiko zu minimieren, wird die Klassenbezeichnung ausgewählt, die das Risiko R(c|x) für die Stichprobe minimieren kann, d. h. h∗ ist der optimale Bayes-Klassifikator.

vor 6 Jahren

Bayes-Modellmittelwertbildung/BMA

Bei der Modellauswahl wählt man typischerweise aus einer Reihe von Kandidatenmodellen das „beste“ Modell aus und verwendet dann dieses ausgewählte „beste“ Modell zur Vorhersage. Im Gegensatz zu einem einzelnen optimalen Modell weist die Bayes'sche Modellmittelung jedem Modell Gewichte zu und führt eine gewichtete Mittelwertbildung durch, um den endgültigen Vorhersagewert zu bestimmen. Darunter ist das einem Modell zugewiesene Gewicht […]

vor 6 Jahren

Bayes-Entscheidungsregel

Wenn h für jede Stichprobe x das bedingte Risiko R(h(x)|x) minimieren kann, wird auch das Gesamtrisiko minimiert. Dies führt zur Bayes-Entscheidungsregel: Um das Gesamtrisiko zu minimieren, müssen wir nur diejenige auswählen, die das bedingte Risiko R(c|x […]) erfüllt.

vor 6 Jahren

BN-Batch-Normalisierung

BN ist eine Reihe von Regularisierungsmethoden, die das Training großer Faltungsnetzwerke beschleunigen und die Klassifizierungsgenauigkeit nach der Konvergenz verbessern können. Wenn BN in einer bestimmten Schicht eines neuronalen Netzwerks verwendet wird, standardisiert es die internen Daten jedes Mini-Batches, normalisiert die Ausgabe auf die Normalverteilung von N(0,1) und reduziert […]

vor 6 Jahren

Basis-Lernalgorithmus

Beim Ensemble-Lernen sind die von der Gruppe generierten „individuellen Lernenden“ homogen. Solche Lerner werden als Basislerner bezeichnet, und die entsprechenden Lernalgorithmen heißen Basislernalgorithmen.

vor 6 Jahren

Langzeit-Kurzzeitgedächtnis

Long Short-Term Memory (LSTM) ist ein zeitrekursives neuronales Netzwerk (RNN), das erstmals 1997 veröffentlicht wurde. Aufgrund seiner einzigartigen Designstruktur eignet sich LSTM für die Verarbeitung und Vorhersage wichtiger Ereignisse in Zeitreihen mit sehr langen Intervallen und Verzögerungen […]

vor 6 Jahren

Informationsentropie

Die Informationsentropie ist eine Größe, die sich zur Messung der Informationsmenge eignet. Es wurde 1948 von Shannon vorgeschlagen. Dabei wurde das Konzept der Entropie aus der Thermodynamik übernommen und die durchschnittliche Informationsmenge nach Ausschluss von Redundanz in Informationen als Informationsentropie bezeichnet und der entsprechende mathematische Ausdruck angegeben. Die drei Eigenschaften der Informationsentropie sind Monotonie: Je höher die Wahrscheinlichkeit eines Ereignisses, desto mehr Informationen enthält es […]

vor 7 Jahren

Wissensrepräsentation

Unter Wissensrepräsentation versteht man die Darstellung und Beschreibung von Wissen. Es geht darum, wie Agenten relevantes Wissen sinnvoll nutzen können. Dies ist eine Studie des Denkens als Rechenprozess. Genau genommen handelt es sich bei Wissensrepräsentation und wissensbasierter Argumentation um zwei eng miteinander verbundene Konzepte im selben Forschungsfeld. Tatsächlich wird der Begriff Wissensrepräsentation jedoch auch verwendet, um ein umfassenderes Konzept zu bezeichnen, das auch die Argumentation einschließt.

vor 7 Jahren

Exponentielle Verlustfunktion

Die exponentielle Verlustfunktion ist eine häufig verwendete Verlustfunktion im AdaBoost-Algorithmus. Der Funktionsausdruck liegt in Exponentialform vor, wie im folgenden Diagramm dargestellt. Häufiger Verlustfehler Exponentialer Verlust Exponentialer Verlust: Wird hauptsächlich im Ensemble-Lernalgorithmus von Adaboost verwendet; Scharnierverlust H […]

vor 7 Jahren

Grundwahrheit

Im Bereich des maschinellen Lernens bezieht sich Wahrheit auf den genauen Einstellwert des Trainingssatzes für das Klassifizierungsergebnis beim überwachten Lernen, der im Allgemeinen zur Fehlerschätzung und Effektbewertung verwendet wird. Beim überwachten Lernen erscheinen beschriftete Daten normalerweise in der Form (x, t), wobei x die Eingabedaten und t die Beschriftung darstellt. Die richtige Bezeichnung ist Grou […]

vor 7 Jahren

Fehler-Mehrdeutigkeitszerlegung

Unter Fehler-Divergenz-Zerlegung versteht man den Prozess der Zerlegung des integrierten Generalisierungsfehlers, der wie folgt ausgedrückt werden kann: ${E= \overline {E}- \overline {A}}$ , wobei die linke Seite E den integrierten Generalisierungsfehler darstellt und die rechte Seite $latex {\over […]

vor 7 Jahren

Markov-Ketten-Monte-Carlo-Methode MCMC

MCMC ist ein Algorithmus zur Stichprobenziehung aus Zufallsverteilungen auf der Grundlage von Markow-Ketten, der die Posterior-Verteilung des betreffenden Parameters durch Zufallsstichprobenziehung im Wahrscheinlichkeitsraum approximiert. Die grundlegende Theorie von MCMC ist der Markow-Prozess. Um in verwandten Algorithmen eine Stichprobe auf einer bestimmten Verteilung zu ziehen, können wir gemäß dem Markow-Prozess von jedem Zustand aus simulieren.

vor 7 Jahren

Evolutionäre Berechnung

Der Evolutionsalgorithmus ist eine allgemeine Methode zur Problemlösung, die auf der natürlichen Selektion und den natürlichen genetischen Mechanismen der biologischen Welt basiert. Grundlegende Methode: Verwenden Sie einfache Codierungstechnologie, um verschiedene komplexe Strukturen darzustellen, verwenden Sie einfache genetische Operationen und die natürliche Selektion des Überlebens des Stärkeren, um das Lernen zu steuern und die Suchrichtung zu bestimmen. Nutzen Sie die Bevölkerung, um die Suche zu organisieren, sodass […]

vor 7 Jahren

Command Palette

Wiki

Command Palette

Wiki

Boltzmann-Maschine

Zweiteilige Partition

Binomialtest

Binäre Klassifizierung

Bidirektionales Langzeit-Kurzzeitgedächtnis/Bi-LSTM

Bias-Varianz-Dilemma

Bias-Varianz-Zerlegung

Voreingenommenheit

Streumatrix Zwischen Den Klassen

Bayes-Netzwerk

Bayesianische Entscheidungstheorie

Bayes Optimaler Klassifikator

Bayes-Modellmittelwertbildung/BMA

Bayes-Entscheidungsregel

BN-Batch-Normalisierung

Basis-Lernalgorithmus

Langzeit-Kurzzeitgedächtnis

Informationsentropie

Wissensrepräsentation

Exponentielle Verlustfunktion

Grundwahrheit

Fehler-Mehrdeutigkeitszerlegung

Markov-Ketten-Monte-Carlo-Methode MCMC

Evolutionäre Berechnung

Command Palette

Wiki

Boltzmann-Maschine

Zweiteilige Partition

Binomialtest

Binäre Klassifizierung

Bidirektionales Langzeit-Kurzzeitgedächtnis/Bi-LSTM

Bias-Varianz-Dilemma

Bias-Varianz-Zerlegung

Voreingenommenheit

Streumatrix Zwischen Den Klassen

Bayes-Netzwerk

Bayesianische Entscheidungstheorie

Bayes Optimaler Klassifikator

Bayes-Modellmittelwertbildung/BMA

Bayes-Entscheidungsregel

BN-Batch-Normalisierung

Basis-Lernalgorithmus

Langzeit-Kurzzeitgedächtnis

Informationsentropie

Wissensrepräsentation

Exponentielle Verlustfunktion

Grundwahrheit

Fehler-Mehrdeutigkeitszerlegung

Markov-Ketten-Monte-Carlo-Methode MCMC

Evolutionäre Berechnung

Boltzmann-Maschine

Zweiteilige Partition

Binomialtest

Binäre Klassifizierung

Bidirektionales Langzeit-Kurzzeitgedächtnis/Bi-LSTM

Bias-Varianz-Dilemma

Bias-Varianz-Zerlegung

Voreingenommenheit

Streumatrix Zwischen Den Klassen

Bayes-Netzwerk

Bayesianische Entscheidungstheorie

Bayes Optimaler Klassifikator

Bayes-Modellmittelwertbildung/BMA

Bayes-Entscheidungsregel

BN-Batch-Normalisierung

Basis-Lernalgorithmus

Langzeit-Kurzzeitgedächtnis

Informationsentropie

Wissensrepräsentation

Exponentielle Verlustfunktion

Grundwahrheit

Fehler-Mehrdeutigkeitszerlegung

Markov-Ketten-Monte-Carlo-Methode MCMC

Evolutionäre Berechnung

Boltzmann-Maschine

Zweiteilige Partition