HyperAI초신경

정도

정도정보 검색 및 통계적 분류에 사용되는 지표로, 추출된 올바른 샘플 수에 대한 추출된 샘플 수의 비율을 나타냅니다. 비슷한 개념으로 재현율이 있는데, 이는 추출된 샘플 수를 전체 샘플 수로 나눈 비율을 말합니다.

두 개념의 차이점(혼란 행렬의 정확도)

이진 분류의 네 가지 결과는 혼동 행렬이라고도 하며, 다음 그림과 같습니다.

진정한 카테고리예측은 긍정적이다예측은 부정적이다
긍정적인 예TP(실제 사례)FP(거짓 반례)
반례FN(거짓 양성)TN(참 반례)

위 결과와 관련된 몇 가지 지표:

정밀도 P = TP / (TP + FP) 1로 예측된 샘플이 실제로 1일 확률

실제로 1인 샘플에서 1의 값을 예측할 확률은 R = TP / (TP + FN)입니다.

두 값이 모두 0과 1 사이일 때, 값이 1에 가까울수록 재현율이나 정밀도가 높아집니다.

두 개념 사이의 연결

정밀도와 재현율은 머신 러닝의 성능 지표를 판단하는 데 자주 사용됩니다. 두 가지 주요 유형이 있습니다: P-R 곡선과 F1 메트릭:

P-R 곡선:정밀도와 재현율을 각각 X축과 Y축으로 하여 얻은 곡선입니다.

F1 메트릭:정밀도와 재현율의 조화 평균은 1 / F 1 = 1 / 2 * (1 / P + 1 / R)로 정의됩니다.