HyperAI

Präzision

PräzisionEs handelt sich um eine Metrik, die bei der Informationsbeschaffung und statistischen Klassifizierung verwendet wird und sich auf das Verhältnis der extrahierten korrekten Stichproben zur Anzahl der extrahierten Stichproben bezieht. Ein ähnliches Konzept ist der Recall, der sich auf das Verhältnis der Anzahl extrahierter Proben zur Gesamtzahl der Proben bezieht.

Der Unterschied zwischen den beiden Konzepten (Genauigkeit der Konfusionsmatrix)

Die vier Ergebnisse der binären Klassifizierung werden auch als Konfusionsmatrix bezeichnet, wie in der folgenden Abbildung dargestellt:

Wahre KategorieDie Prognose ist positivVorhersage ist negativ
Positives BeispielTP (Wahres Beispiel)FP (Falsches Gegenbeispiel)
GegenbeispielFN (Falsch-Positiv)TN (wahres Gegenbeispiel)

Mehrere Kennzahlen im Zusammenhang mit den obigen Ergebnissen:

Präzision P = TP / (TP + FP) Die Wahrscheinlichkeit, dass eine als 1 vorhergesagte Stichprobe tatsächlich 1 ist

Rückruf R = TP / (TP + FN) Die Wahrscheinlichkeit, einen Wert von 1 in einer Stichprobe vorherzusagen, die tatsächlich 1 ist

Wenn beide Werte zwischen 0 und 1 liegen, ist der Rückruf bzw. die Präzision umso höher, je näher der Wert bei 1 liegt.

Die Verbindung zwischen den beiden Konzepten

Präzision und Rückruf werden häufig verwendet, um die Leistungsindikatoren des maschinellen Lernens zu beurteilen. Es gibt zwei Haupttypen: P-R-Kurve und F1-Metrik:

P-R-Kurve:Die mit Präzision erhaltene Kurve wird als X-Achse bzw. Y-Achse wiedergegeben.

F1-Metrik:Der harmonische Mittelwert aus Präzision und Rückruf, definiert als 1 / F 1 = 1 / 2 * (1 / P + 1 / R).