HyperAI초신경

검량선

교정 곡선은 기계 학습 및 예측 모델링에서 분류 모델의 예측 확률에 대한 신뢰성을 이해하고 미세 조정하는 데 유용한 도구입니다. 이러한 확률을 바탕으로 정보에 입각한 결정을 내리려면 잘 보정된 모델이 중요합니다. 

검량선 작성

검정 곡선을 구성하는 과정에는 몇 가지 주요 단계가 포함됩니다.

  • 확률 예측:각 인스턴스에 대한 예측 확률을 제공하는 분류 모델부터 시작합니다. 이러한 예측 확률은 인스턴스가 특정 클래스에 속한다는 모델의 확신도를 나타냅니다.
  • 권투:예측 확률에 따라 인스턴스를 빈이나 간격으로 그룹화합니다. 각 빈에는 유사한 예측 확률을 공유하는 인스턴스의 하위 집합이 포함되어 있습니다.
  • 믿다: 각 빈에 대해 빈의 인스턴스의 평균 예측 확률을 계산합니다. 동시에, 빈 내에서 관찰된 긍정적인 결과의 빈도가 계산됩니다.
  • 그림: x축에 평균 예측 확률을 표시하고 y축에 관찰된 빈도(또는 경험적 확률)를 표시합니다. 그 결과 나온 그래프가 검정 곡선입니다.

검량선 해석

완벽하게 보정된 모델은 플롯의 45도 대각선과 밀접하게 일치하는 보정 곡선을 갖습니다. 이 선은 예측된 확률이 관찰된 빈도와 일치하는 이상적인 보정을 나타냅니다. 이 대각선에서 벗어나는 것은 모델의 예측이 지나치게 확신하거나 확신이 부족하다는 것을 나타냅니다.

  • 과신: 곡선이 대각선 위에 있으면 모델이 지나치게 자신감을 갖고 있다는 뜻입니다. 이는 예측 확률이 1에 가까운 사례가 실제 성공률보다 훨씬 많다는 것을 의미하며, 모델은 실제 성공률보다 예측에 더 확신을 갖고 있습니다.
  • 자신감 부족:곡선이 대각선 아래에 있으면 모델의 신뢰도가 낮습니다. 이 경우 예측 확률이 높은 인스턴스는 실제 성공률보다 적게 나타나며, 모델의 신뢰도는 실제 성공률보다 낮습니다.

검량선의 중요성

교정 곡선은 분류 모델의 예측 확률이 실제 결과와 정확히 일치하는지 확인하여 신뢰할 수 있는 해석과 확실한 의사 결정을 가능하게 합니다. 검정 곡선을 평가하면 지나치게 확신하거나 확신이 부족한 예측을 피할 수 있으므로 모델의 유용성이 향상됩니다.

  • 신뢰할 수 있는 확률 추정: 잘 교정된 모델의 예측 확률은 신뢰할 수 있는 신뢰도 추정치로 해석될 수 있습니다. 이는 모델 결과를 바탕으로 정보에 입각한 결정을 내리는 데 중요합니다.
  • 잘못된 보정 방지: 부적절하게 보정된 모델은 잘못된 결정으로 이어질 수 있습니다. 예를 들어, 제대로 교정되지 않은 의료 진단 모델은 부적절한 치료로 이어질 수 있습니다.
  • 강력한 의사 결정: 제대로 교정되지 않은 모델을 기반으로 한 결정 임계값은 최적이 아닌 결과를 초래할 수 있습니다. 교정은 결정이 성공의 실제 확률을 반영하도록 보장합니다.

검량선의 적용

교정 곡선은 의사 결정에 정확한 확률 추정이 중요한 다양한 분야에 적용됩니다. 검량선은 의료 진단에 사용되어 신뢰할 수 있는 의학적 예측을 보장하고, 금융 신용 평가에 사용되어 위험 평가를 강화하며, 사기 탐지에 사용되어 거래 보안을 최적화합니다. 교정 곡선은 정보에 기반한 조치를 추진하기 위한 신뢰할 수 있는 신뢰도 추정치를 제공하는 데 중요한 역할을 합니다. 

  • 의학적 진단: 의료 분야에서 검량 곡선은 진단 모델이 의학적 상태에 대한 정확하고 신뢰할 수 있는 신뢰도 추정치를 제공하는지 확인하는 데 도움이 됩니다.
  • 신용 점수: 금융 부문에서 보정된 신용 위험 모델은 대출 불이행 확률에 대한 정확한 추정치를 제공하고 위험 평가에 도움을 줄 수 있습니다.
  • 사기 감지: 사기 감지에서 잘 교정된 모델은 사기 거래를 식별할 수 있는 신뢰할 수 있는 확률을 제공할 수 있습니다.

참고문헌

【1】https://encord.com/glossary/calibration-curve/