Präzision
PräzisionEs handelt sich um eine Metrik, die bei der Informationsbeschaffung und statistischen Klassifizierung verwendet wird und sich auf das Verhältnis der extrahierten korrekten Stichproben zur Anzahl der extrahierten Stichproben bezieht. Ein ähnliches Konzept ist der Recall, der sich auf das Verhältnis der Anzahl extrahierter Proben zur Gesamtzahl der Proben bezieht.
Der Unterschied zwischen den beiden Konzepten (Genauigkeit der Konfusionsmatrix)
Die vier Ergebnisse der binären Klassifizierung werden auch als Konfusionsmatrix bezeichnet, wie in der folgenden Abbildung dargestellt:
Wahre Kategorie | Die Prognose ist positiv | Vorhersage ist negativ |
Positives Beispiel | TP (Wahres Beispiel) | FP (Falsches Gegenbeispiel) |
Gegenbeispiel | FN (Falsch-Positiv) | TN (wahres Gegenbeispiel) |
Mehrere Kennzahlen im Zusammenhang mit den obigen Ergebnissen:
Präzision P = TP / (TP + FP) Die Wahrscheinlichkeit, dass eine als 1 vorhergesagte Stichprobe tatsächlich 1 ist
Rückruf R = TP / (TP + FN) Die Wahrscheinlichkeit, einen Wert von 1 in einer Stichprobe vorherzusagen, die tatsächlich 1 ist
Wenn beide Werte zwischen 0 und 1 liegen, ist der Rückruf bzw. die Präzision umso höher, je näher der Wert bei 1 liegt.
Die Verbindung zwischen den beiden Konzepten
Präzision und Rückruf werden häufig verwendet, um die Leistungsindikatoren des maschinellen Lernens zu beurteilen. Es gibt zwei Haupttypen: P-R-Kurve und F1-Metrik:
P-R-Kurve:Die mit Präzision erhaltene Kurve wird als X-Achse bzw. Y-Achse wiedergegeben.
F1-Metrik:Der harmonische Mittelwert aus Präzision und Rückruf, definiert als 1 / F 1 = 1 / 2 * (1 / P + 1 / R).