Wiki
Wir haben Hunderte von verwandten Einträgen zusammengestellt, um Ihnen zu helfen, "künstliche Intelligenz" zu verstehen
Der Begriff „Rauschen“ wird zur Beschreibung unerwünschter oder irrelevanter Informationen in einem Bild oder Video verwendet. Die Ursachen können vielfältig sein, unter anderem Sensorrauschen, Kompressionsartefakte und Umgebungsfaktoren wie Lichtverhältnisse und Reflexionen. Rauschen kann die Qualität und Klarheit eines Bildes oder Videos erheblich beeinträchtigen und die genaue Analyse oder Interpretation des Bildinhalts erschweren.
Panoptische Segmentierung ist eine Computervisionsaufgabe, bei der ein Bild oder Video in verschiedene Objekte und ihre jeweiligen Teile segmentiert und jedes Pixel mit der entsprechenden Klasse gekennzeichnet wird.
Beim maschinellen Lernen treten Fehler 2. Typs (auch als falsch-negative Ergebnisse bezeichnet) auf, wenn ein Modell fälschlicherweise vorhersagt, dass eine bestimmte Bedingung oder ein bestimmtes Attribut nicht vorhanden ist, obwohl dies tatsächlich der Fall ist.
Beim maschinellen Lernen treten Fehler 1. Typs, auch als falsch positive Ergebnisse (FP) bezeichnet, auf, wenn ein Modell das Vorhandensein einer Bedingung oder eines Attributs fälschlicherweise vorhersagt, obwohl dies tatsächlich nicht der Fall ist.
Ein vortrainiertes Modell ist ein maschinelles Lernmodell (ML), das anhand eines großen Datensatzes trainiert wurde und für eine bestimmte Aufgabe optimiert werden kann. Vortrainierte Modelle werden häufig als Ausgangspunkt für die Entwicklung von ML-Modellen verwendet. Sie bieten einen ersten Satz an Gewichtungen und Verzerrungen, der für eine bestimmte Aufgabe feinabgestimmt werden kann.
Die Modellpräzision, auch Modellgenauigkeit genannt, ist ein Maß für die Fähigkeit eines Machine-Learning-Modells (ML), auf der Grundlage von Daten Vorhersagen oder Entscheidungen zu treffen. Es handelt sich um eine gängige Metrik zur Bewertung der Leistung von ML-Modellen und kann verwendet werden, um die Leistung verschiedener Modelle zu vergleichen oder die Wirksamkeit eines bestimmten Modells für eine bestimmte Aufgabe zu beurteilen.
Im Zweig der Mathematik, der als numerische Analyse bekannt ist, ist die Polynominterpolation der Prozess der Interpolation eines gegebenen Datensatzes mithilfe eines Polynoms. Mit anderen Worten: Das Ziel besteht darin, für einen gegebenen Datensatz (z. B. Daten aus einer Stichprobe) ein Polynom zu finden, das durch diese Datenpunkte verläuft.
Im Bereich des maschinellen Lernens (ML) ist Interpolation der Prozess der Schätzung des Werts einer Funktion oder eines Datensatzes an Punkten zwischen bekannten Datenpunkten. Interpolation wird häufig verwendet, um fehlende Werte in einem Datensatz zu ergänzen oder Rauschen oder Unregelmäßigkeiten in den Daten zu entfernen.
Beim maschinellen Lernen (ML) ist die Lernrate ein Hyperparameter, der die Schrittweite für die Aktualisierung der Modellparameter während des Trainings bestimmt.
Keypoint ist ein sehr verbreitetes Konzept im Bereich der Computer Vision. Schlüsselpunkte sind eindeutige oder hervorstechende Punkte in einem Bild oder Video, die zum Identifizieren, Beschreiben oder Zuordnen von Objekten oder Merkmalen in einer Szene verwendet werden können.
Die mittlere durchschnittliche Präzision (mAP) ist eine weit verbreitete Leistungsmetrik bei Objekterkennungsaufgaben im maschinellen Lernen.
Der Lebenszyklus im maschinellen Lernen (ML) ist der Prozess der Entwicklung und Bereitstellung von ML-Modellen zur Lösung realer Probleme. Es umfasst normalerweise eine Reihe von Schritten, darunter Datenvorbereitung, Modelltraining und -bewertung, Modellbereitstellung, Modellüberwachung und -wartung.
Im Bereich des maschinellen Lernens (ML) beziehen sich Beschriftungsfehler auf falsche oder ungenaue Beschriftungen, die Beispielen in einem Datensatz zugewiesen werden.
Beschriftungen in der Computervision sind Text- oder Zahlenanmerkungen, die Objekten oder interessanten Bereichen in Bildern oder Videos zugewiesen werden.
Intersection over Union (IOU) ist eine Leistungsmetrik, die zur Bewertung der Genauigkeit von Annotations-, Segmentierungs- und Objekterkennungsalgorithmen verwendet wird. Es quantifiziert die Überlappung zwischen den vorhergesagten Begrenzungsrahmen oder segmentierten Regionen und den Ground-Truth-Begrenzungsrahmen oder annotierten Regionen im Datensatz.
Instanzsegmentierung ist eine Computer-Vision-Technik, die einzelne Objekte in einem Bild identifiziert und segmentiert. Im Gegensatz zur semantischen Segmentierung, bei der Pixel auf der Grundlage ihrer semantischen Bedeutung (z. B. Straße, Himmel, Person) gruppiert werden, unterscheidet die Instanzsegmentierung zwischen mehreren Instanzen derselben Objektklasse.
In der Computervision verwenden Graustufenbilder zur Darstellung einer Szene oder eines Objekts eine Reihe von Graustufentönen und nicht das gesamte Spektrum. Graustufenbilder werden normalerweise durch die Konvertierung eines Vollfarbbilds in ein Einkanalbild erstellt, wobei die Intensität jedes Pixels durch einen einzelnen Wert zwischen 0 (Schwarz) und 255 (Weiß) dargestellt wird.
Beim maschinellen Lernen sind Features die Eingabevariablen oder Attribute, die zum Trainieren eines Modells verwendet werden. Diese Merkmale stellen Merkmale oder Eigenschaften der analysierten Daten dar und werden vom Modell verwendet, um Vorhersagen oder Klassifizierungen zu treffen.
Die Anzahl der Bilder pro Sekunde (fps) gibt an, wie viele Standbilder oder Einzelbilder in einer Sekunde eines Videos oder einer Animation angezeigt werden.
HITL ist ein iterativer Feedbackprozess, bei dem eine Person (oder ein Team) mit einem algorithmisch generierten System (z. B. Computer Vision, maschinelles Lernen oder künstliche Intelligenz) interagiert.
Beim maschinellen Lernen sind Hyperparameter Parameter, die im Voraus vorgegeben werden, um den Lernprozess zu steuern. Die Werte anderer Parameter (z. B. Knotengewichte) werden durch Training ermittelt.
Im Hinblick auf Computer Vision können Diffusionsmodelle auf eine Vielzahl von Aufgaben angewendet werden, darunter Bildentrauschung, Inpainting, Superauflösung und Bildgenerierung.
Im Bereich Deep Learning bezieht sich Ground Truth (im Englischen allgemein verwendet, bedeutet es „Grundwahrheit“ oder im Chinesischen „Benchmark-Wahrheit“, einfach verstanden als der wahre Wert) auf die genauen Bezeichnungen oder Daten, die zum Trainieren und Bewerten von Modellen verwendet werden.
Unter Bildannotation versteht man das Markieren oder Kommentieren von Bildern mit Metadaten oder zusätzlichen Informationen zum Bildinhalt.