
최근 몇 년간 딥러닝 기반의 방법은 컴퓨터 비전 분야에서 희망적인 성과를 보여주고 있다. 그러나 일반적인 딥러닝 모델은 레이블이 붙은 대량의 데이터를 필요로 하며, 이러한 데이터를 수집하고 레이블링하는 과정은 인력이 많이 소모된다. 게다가, 학습 데이터와 테스트 데이터 사이의 도메인 전이(domain shift)로 인해 모델의 성능이 크게 저하될 수 있다. 텍스트 인식은 컴퓨터 비전 분야에서 널리 연구되고 있는 주제이며, 폰트의 다양성과 복잡한 배경 요소로 인해 위와 같은 문제에 취약하다. 본 논문에서는 텍스트 인식 문제에 초점을 맞추어 세 가지 주요 기여를 한다. 첫째, 다양한 도메인을 포함한 다중 소스 도메인 적응(distribution adaptation) 데이터셋을 구축하였으며, 총 다섯 가지 다른 도메인에서 500만 장 이상의 이미지를 포함하고 있다. 이는 현재까지 알려진 바에 따르면 최초의 다중 도메인 텍스트 인식 데이터셋이다. 둘째, 자가학습(self-learning) 기법과 메타학습(meta-learning) 패러다임을 결합한 새로운 방법인 메타 자체학습(Meta Self-Learning)을 제안하였으며, 다중 도메인 환경에서 뛰어난 인식 성능을 달성하였다. 셋째, 제안한 데이터셋을 기반으로 광범위한 실험을 수행하여 기준 성능(benchmark)을 제시하고, 본 방법의 효과성을 입증하였다. 본 연구의 코드 및 데이터셋은 곧 다음 웹사이트에서 공개될 예정이다: https://bupt-ai-cz.github.io/Meta-SelfLearning/.