2달 전
TextCaps: 매우 적은 데이터셋을 사용한 손글씨 문자 인식
Vinoj Jayasundara; Sandaru Jayasekara; Hirunima Jayasekara; Jathushan Rajasegaran; Suranga Seneviratne; Ranga Rodrigo

초록
최근 문자 인식 시스템의 발전으로 인해 많은 지역화된 언어가 충분한 라벨링된 훈련 데이터 부족으로 이들의 혜택을 받지 못하고 있습니다. 이는 이러한 언어에 대해 대규모의 라벨링된 데이터를 생성하는 것이 어렵고, 딥러닝 기술이 적은 수의 훈련 샘플에서 제대로 학습하지 못하기 때문입니다. 우리는 이 문제를 해결하기 위해, 인간의 필기체에 실제로 존재하는 변형을 반영하는 현실적인 증강을 통해 기존 샘플에서 새로운 훈련 샘플을 생성하는 기술을 소개합니다. 이를 위해 해당 인스턴스 매개변수에 임의로 제어된 노이즈를 추가합니다. 클래스당 단 200개의 훈련 샘플만으로도 EMNIST-문자 데이터셋에서 기존의 문자 인식 결과를 초월하였으며, EMNIST-균형, EMNIST-숫자, 그리고 MNIST 세 가지 데이터셋에서 기존 결과와 동등한 성능을 달성하였습니다. 또한, 재구성을 개선하기 위해 손실 함수 조합을 효과적으로 활용하는 전략도 개발하였습니다. 우리의 시스템은 라벨링된 훈련 데이터가 부족한 지역화된 언어의 문자 인식뿐만 아니라 객체 인식과 같은 다른 관련 분야에서도 유용하게 사용될 수 있습니다.