데이터 증강
데이터 증강은 기존 데이터를 사용하여 데이터 세트의 수정된 복사본을 만들어서 훈련 세트를 인위적으로 늘리는 기술입니다.딥 러닝에서 일반적으로 사용되는 기술 중 하나인 은 데이터 세트를 약간 변경하거나 딥 러닝을 사용하여 새로운 데이터 포인트를 생성하는 것을 포함합니다. 데이터 증강은 주로 훈련 데이터 세트를 늘리고 데이터 세트를 최대한 다양하게 만들어 훈련된 모델의 일반화 능력이 강화되도록 하는 데 사용됩니다. 기존의 모든 주요 딥러닝 프레임워크에는 이미 데이터 증강 기능이 포함되어 있습니다.
데이터 증강을 사용하기 위한 시나리오
- 모델 과잉적합을 방지합니다.
- 초기 훈련 세트가 너무 작습니다.
- 모델 정확도를 향상시키려면.
- 원시 데이터 세트에 대한 라벨링 및 정리 작업의 운영 비용을 줄입니다.
데이터 증강의 한계
- 원래 데이터 세트의 편향은 증강된 데이터에도 여전히 존재합니다.
- 데이터 증강에 대한 품질 보증은 비용이 많이 듭니다.
- 고급 응용 프로그램을 갖춘 시스템을 구축하려면 연구 개발이 필요합니다. 예를 들어, GAN을 사용하여 고해상도 이미지를 생성하는 것은 어려울 수 있습니다.
- 효과적인 데이터 증강 방법을 찾는 것은 어려울 수 있습니다.