HyperAI초신경

분포 외 일반화

분포 외 일반화(OOD 일반화)는 훈련 데이터의 분포가 테스트 데이터의 분포와 일치하지 않을 때 모델의 일반화 능력 문제를 해결하는 것을 목표로 합니다. 이는 알려지지 않았거나 보이지 않는 데이터 분포에 직면했을 때 모델이 좋은 성능과 안정성을 유지하는 방법에 초점을 맞춥니다.

기존의 머신 러닝 작업에서는 일반적으로 학습 데이터와 테스트 데이터가 동일한 분포(독립적이고 동일하게 분포, iid)에서 나온다고 가정합니다. 그러나 실제 적용에서는 이런 가정이 적용되지 않는 경우가 많습니다. 예를 들어, 훈련 데이터는 특정 환경이나 조건에서 나온 반면, 테스트 데이터는 완전히 다른 환경에서 나온 것일 수 있습니다. 이러한 분포 차이로 인해 테스트 데이터에 대한 모델 성능이 크게 떨어질 수 있습니다. 분포 외 일반화의 목표는 분포 이동 문제를 해결하여 모델이 보이지 않는 데이터 분포에 적응하고 일반화할 수 있도록 하는 것입니다.