HyperAI초신경

데이터 증강

데이터 증강은 기존 데이터를 사용하여 데이터 세트의 수정된 복사본을 만들어서 훈련 세트를 인위적으로 늘리는 기술입니다.딥 러닝에서 일반적으로 사용되는 기술 중 하나인 은 데이터 세트를 약간 변경하거나 딥 러닝을 사용하여 새로운 데이터 포인트를 생성하는 것을 포함합니다. 데이터 증강은 주로 훈련 데이터 세트를 늘리고 데이터 세트를 최대한 다양하게 만들어 훈련된 모델의 일반화 능력이 강화되도록 하는 데 사용됩니다. 기존의 모든 주요 딥러닝 프레임워크에는 이미 데이터 증강 기능이 포함되어 있습니다.

데이터 증강을 사용하기 위한 시나리오

  1. 모델 과잉적합을 방지합니다.
  2. 초기 훈련 세트가 너무 작습니다.
  3. 모델 정확도를 향상시키려면.
  4. 원시 데이터 세트에 대한 라벨링 및 정리 작업의 운영 비용을 줄입니다. 

데이터 증강의 한계

  • 원래 데이터 세트의 편향은 증강된 데이터에도 여전히 존재합니다.
  • 데이터 증강에 대한 품질 보증은 비용이 많이 듭니다. 
  • 고급 응용 프로그램을 갖춘 시스템을 구축하려면 연구 개발이 필요합니다. 예를 들어, GAN을 사용하여 고해상도 이미지를 생성하는 것은 어려울 수 있습니다.
  • 효과적인 데이터 증강 방법을 찾는 것은 어려울 수 있습니다.