17일 전

증강을 활용한 모델 성능 향상 및 클래스 불균형 문제 제거

{Dr. Venkateswara Rao Gurrala, Allena Venkata Sai Abhishek}
초록

실세계의 데이터는 다양한 종류의 복잡한 특징을 포함하고 있다. 그 중에서도 가장 흔히 발견되는 특징은 데이터셋 내 각 클래스에 속하는 예시의 수가 불균형한 '클래스 불균형(Class Imbalance)' 문제이다. 이 클래스 불균형 문제는 데이터에 다양한 샘플링 기법을 적용함으로써 해결되고 있다. 증강 기법(Augmentation)은 어떤 머신러닝 파이프라인에서도 필수적인 단계 중 하나로, 소수 클래스의 데이터를 과잉 샘플링하는 데 사용된다. 본 연구는 다양한 증강 기법을 활용하여 균형 잡힌 증강 데이터셋을 생성하고, 이를 통해 클래스 불균형 문제를 제거함으로써 모델 성능을 향상시키는 것을 목표로 한다. 또한, 랜덤 샘플링을 병행하여 다양한 증강 기법을 적용한 결과를 비교 분석한다. 각 증강 기법에 대해 RESNET18 모델을 사용하여 정확도를 측정하였으며, 각 경우에 대해 최대 100 에포크까지 모델을 학습시켰다. 이후 각 기법의 최고 정확도를 비교함으로써, 다양한 증강 기법의 효과성에 대한 놀라운 통찰을 도출할 수 있었다.