Wiki
Wir haben Hunderte von verwandten Einträgen zusammengestellt, um Ihnen zu helfen, "künstliche Intelligenz" zu verstehen
Die verborgene Schicht bezieht sich auf die Schicht außer der Eingabeschicht und der Ausgabeschicht in einem mehrstufigen Feedforward-Neuralnetzwerk. Die verborgene Schicht empfängt weder direkt externe Signale noch sendet sie direkt Signale an die Außenwelt. Es wird nur benötigt, wenn die Daten nichtlinear getrennt sind. Neuronen in verborgenen Schichten können viele Formen annehmen, wie z. B. Max-Pooling-Schichten und Faltungsschichten, die jeweils eine andere mathematische Funktion erfüllen, […]
Hard Voting ist eine Abstimmungsmethode, die Klassenbezeichnungen direkt ausgibt und hauptsächlich in Klassifizierungsalgorithmen für maschinelles Lernen zu finden ist. Voting ist eine Kombinationsstrategie für Klassifizierungsprobleme beim Ensemble-Lernen. Die Grundidee besteht darin, im Algorithmus die Klasse mit der höchsten Ausgabe auszuwählen. Beim Hard Voting geht es darum, das Label mit der größten Ausgabe des Algorithmus auszuwählen. Bei gleicher Anzahl der Beschriftungen erfolgt eine aufsteigende Sortierung. […]
Unabhängig und identisch verteilt (IID) bedeutet, dass die Wahrscheinlichkeitsverteilung jeder Variablen in einem Satz von Zufallsvariablen gleich ist und diese Zufallsvariablen voneinander unabhängig sind. Dass eine Reihe von Zufallsvariablen unabhängig und identisch verteilt ist, bedeutet nicht, dass die Wahrscheinlichkeit jedes Ereignisses in ihrem Stichprobenraum gleich ist. Beispielsweise ist die Ergebnisfolge beim Würfeln ungleichmäßiger Würfel unabhängig und identisch verteilt, aber die Wahrscheinlichkeit, dass jede Zahl gewürfelt wird, [...]
Inkrementelles Lernen bedeutet, dass beim Hinzufügen neuer Daten nur die neuen Daten aktualisiert werden. Durch inkrementelles Lernen kann kontinuierlich neues Wissen aus neuen Beispielen gewonnen werden, während der Großteil des zuvor erlernten Wissens erhalten bleibt. Inkrementelles Lernen ähnelt dem menschlichen Lernmodell, bei dem es sich um einen Prozess der schrittweisen Ansammlung und Aktualisierung handelt. Die traditionelle Lernmethode ist Batch-Lernen, bei dem alle Daten vorbereitet werden[…]
Eine Wissensdatenbank ist eine spezielle Datenbank, die für das Wissensmanagement verwendet wird, um die Sammlung, Organisation und Extraktion relevanten Domänenwissens zu erleichtern. Das Wissen in der Datenbank stammt von Fachexperten. Es handelt sich um eine Sammlung von Fachwissen zur Problemlösung, das grundlegende Fakten, Regeln und andere relevante Informationen umfasst. Die Wissensbasis ist ein strukturiertes, einfach zu bedienendes, leicht zu verwendendes und umfassendes Wissens-Engineering[…]
K-Nearest-Neighbor-Algorithmus (KNN) ist ein grundlegender Klassifizierungs- und Regressionsalgorithmus, der die ihm am nächsten liegenden K Punkte zur Bestimmung der Klassifizierung kategorialer Daten verwendet. KNN-Funktionen KNN ist eine Methode des Lazy Learning. KNN weist eine hohe Rechenkomplexität auf. Unterschiedliche K-Werte führen zu unterschiedlichen Klassifizierungsergebnissen.
Die JS-Divergenz misst die Ähnlichkeit zweier Wahrscheinlichkeitsverteilungen. Es basiert auf einer Variante der KL-Divergenz und löst das asymmetrische Problem der KL-Divergenz. Im Allgemeinen ist die JS-Divergenz symmetrisch und ihr Wert liegt zwischen 0 und 1. Die Definitionen lauten wie folgt: Bei der Verwendung der KL-Divergenz und der JS-Divergenz als Maß tritt ein Problem auf: Wenn zwei […]
Der Kleinstquadrate-Regressionsbaum ist ein häufig verwendeter Regressionsbaumalgorithmus. Um den quadratischen Fehler zu minimieren, müssen die Werte jedes Merkmals nacheinander durchlaufen und der Fehler jedes möglichen Segmentierungspunkts berechnet werden. Schließlich wird der Punkt mit dem kleinsten Segmentierungsfehler ausgewählt und der Eingaberaum in zwei Teile geteilt. Die obigen Schritte werden rekursiv wiederholt, bis die Segmentierung abgeschlossen ist. Diese Methode […]
Latent Dirichlet Allocation (LDA) ist ein Themenmodell, das das Thema jedes Dokuments in einem Dokumentsatz in Form einer Wahrscheinlichkeitsverteilung ausdrücken kann. Es handelt sich außerdem um einen unüberwachten Lernalgorithmus, der für das Training keinen manuell annotierten Trainingssatz benötigt. Es werden lediglich ein Dokumentensatz und die Anzahl der angegebenen Themen K benötigt. Darüber hinaus muss für jedes Thema […]
Die Mindestbeschreibungslänge, auch als Prinzip der Mindestbeschreibungslänge bekannt, bedeutet, dass unter mehreren Hypothesen zum Speichern von Daten die Hypothese die beste ist, die den größten Datenkomprimierungseffekt erzielen kann. Das Prinzip der minimalen Beschreibungslänge ist eine Formalisierung von Ockhams Rasiermesser, das 1978 von Jorma Rissanen eingeführt wurde. Sein Hauptpunkt ist: In jedem […]
Meta-Learning ist ein Teilgebiet des maschinellen Lernens, bei dem automatisch lernende Algorithmen auf die Metadaten von Experimenten zum maschinellen Lernen angewendet werden. Der Kern des Meta-Lernens ist der „Lern-(Trainings-)Prozess“, bei dem es darum geht, zu untersuchen, wie Neuronen altes Wissen sinnvoll nutzen können, damit sie sich an neue Aufgaben anpassen können. Das schematische Diagramm sieht wie folgt aus: Die Anfangsparameter des neuronalen Netzwerks (blau ■ […]
Max Pooling ist eine häufig verwendete Pooling-Operation, die die Datenmenge durch Maximierung des Werts reduziert. Die übliche Funktionsweise besteht darin, das Eingabebild in mehrere rechteckige Bereiche aufzuteilen und den Maximalwert für jeden Teilbereich auszugeben. Zu den derzeit häufig verwendeten Pooling-Methoden gehören Maximum-Pooling und Average-Pooling, wodurch die komplexen Berechnungen der oberen verborgenen Schicht reduziert werden und die aktuelle […]-Einstellung unbeeinflusst bleibt.
Das maximale Intervall bezieht sich auf die Situation in der Klassifizierungsaufgabe, in der der Abstand zwischen den Trainingsdaten am größten ist. Die Hyperebene, die das maximale Intervall erfüllt, kann die Daten in positive und negative Kategorien unterteilen, und die Entscheidungssicherheit ist zu diesem Zeitpunkt am höchsten. In Support Vector Machines gibt es die Hard Margin Maximization und die Soft Margin Maximization, beides Strategien zum Finden des maximalen Rands.
Das Markow-Zufallsfeld wird auch als Markow-Netzwerk bezeichnet und ist ein Modell, das durch einen ungerichteten Graphen beschrieben wird. Es enthält eine Reihe von Knoten, wobei jeder Knoten einer einzelnen Variable oder einer Gruppe von Variablen entspricht und die Verbindungen zwischen den Knoten ungerichtet sind. Das Markov-Zufallsfeld beschreibt, dass bei mehreren Datenpunkten keine klare Beziehung zwischen zwei Punkten hinsichtlich Vorder- und Rückseite oder Richtung besteht, obwohl eine Beziehung zwischen den beiden Punkten besteht.
Bei der automatischen Zusammenfassung werden Textdokumente mithilfe einer Software gekürzt, um eine Zusammenfassung zu erstellen, die die wichtigsten Punkte des Originaldokuments enthält. Es ist derzeit Teil des Bereichs des maschinellen Lernens und des Data Mining und sein Ziel besteht darin, Teilmengen von Daten zu finden, die relevante „Informationen“ enthalten. Derzeit gibt es zwei Methoden zur automatischen Zusammenfassung: Extraktion und Abstraktion. Die Extraktion basiert auf Wörtern und Phrasen im Originaltext […]
Die automatische Spracherkennungstechnologie ist eine Technologie, die menschliche Sprache in Text umwandelt. Aufgrund der Vielfalt und Komplexität von Sprachsignalen können aktuelle Spracherkennungssysteme nur unter bestimmten Einschränkungen eine zufriedenstellende Leistung erzielen (sie sind nur in bestimmten Situationen anwendbar). Definition der automatischen Spracherkennung Das Ziel der Technologie zur automatischen Spracherkennung besteht darin, Computern zu ermöglichen, „[…]
Ein Autoencoder ist ein künstliches neuronales Netzwerk, das zur effizienten Kodierung beim unüberwachten Lernen verwendet wird, häufig zur Dimensionsreduzierung. Es handelt sich auch um einen Datenkomprimierungsalgorithmus, bei dem die Komprimierungs- und Dekomprimierungsfunktionen der Daten verlustbehaftet sind und automatisch aus Samples gelernt werden. In den meisten Fällen, in denen Autoencoder erwähnt werden, werden die Komprimierungs- und Dekomprimierungsfunktionen jedoch durch neuronale Netzwerke gelernt […]
Der menschliche Aufmerksamkeitsmechanismus basiert auf Intuition. Es ist ein Mittel für den Menschen, mit begrenzten Ressourcen schnell wertvolle Informationen aus einer großen Menge an Informationen herauszufiltern. Der Aufmerksamkeitsmechanismus beim Deep Learning basiert auf der Denkweise der menschlichen Aufmerksamkeit und wird häufig in verschiedenen Szenarien wie der Verarbeitung natürlicher Sprache, der Bildklassifizierung, der Spracherkennung usw. eingesetzt und hat bemerkenswerte Ergebnisse erzielt.
AUC wird als Fläche unter der ROC-Kurve und der Koordinatenachse definiert. Da die ROC-Kurve über y=x liegt, liegt der Wertebereich von AUC zwischen 0,5 und 1. AUC kann beim Vergleich verschiedener Klassifikationsmodelle als Indikator für die Qualität des Modells verwendet werden. Seine Hauptbedeutung liegt in der Tatsache, dass AUC […]
Die Hesse-Matrix, auch als Hessian-Matrix oder Hessian-Matrix bekannt, ist eine Blockmatrix, die aus den partiellen Ableitungen zweiter Ordnung einer multivariaten reellwertigen Funktion besteht. Dies ist eine Verallgemeinerung der Ableitung zweiter Ordnung auf multivariate Funktionen und steht in engem Zusammenhang mit den Extremwerten von Funktionen.
Alpha-Beta-Pruning ist ein Suchalgorithmus, der verwendet wird, um die Anzahl der Knoten im Minimax-Suchbaum zu reduzieren.
Die adaptive Resonanztheorie (kurz ART) ist ein theoretisches Modell, das besagt, dass bei einer Interaktion zwischen einem neuronalen Netzwerk und der Umgebung die Kodierung von Umgebungsinformationen im neuronalen Netzwerk spontan erfolgt und das Netzwerk sich selbst organisieren kann, um die Kodierung von Umgebungswissen zu erzeugen.
Anwendungsspezifische integrierte Schaltkreise, kurz ASICs, sind integrierte Schaltkreise mit speziellen Spezifikationen, die entsprechend unterschiedlicher Produktanforderungen angepasst werden. Im Gegensatz dazu handelt es sich bei nicht kundenspezifischen Schaltungen um anwendungsspezifische Standardprodukte (ASSP).
Ein intelligenter Agent ist eine Software- oder Hardwareeinheit, die autonom agieren kann. Es wurde als „Agent“, „Agent“, „intelligentes Subjekt“ usw. übersetzt.