MRN: 증분 다국어 텍스트 인식을 위한 다중 경로 라우팅 네트워크

다국어 텍스트 인식(MLTR) 시스템은 일반적으로 고정된 언어 집합에 집중하는 경향이 있어, 새로 추가되는 언어를 처리하거나 지속적으로 변화하는 데이터 분포에 적응하는 데 어려움이 있다. 본 논문에서는 증분 학습(IL)의 맥락에서, 다양한 언어가 배치 단위로 점진적으로 도입되는 상황을 고려하여 '증분 다국어 텍스트 인식'(IMLTR) 작업을 제안한다. IMLTR는 과거 데이터를 소량 보존해 기억으로 활용하는 재연(rehearsal) 집합 내에서 샘플 문자의 분포가 불균형한 '재연 불균형'(rehearsal-imbalance) 문제로 인해 특히 도전적인 과제이다. 이 문제를 해결하기 위해, 다중 경로 전달 네트워크(Multiplexed Routing Network, MRN)를 제안한다. MRN은 현재 관측된 각 언어에 대해 독립적인 인식기(recognizer)를 학습한다. 이후 재연 집합을 기반으로 언어 도메인 예측기(domain predictor)를 학습하여 각 인식기의 가중치를 조정한다. 인식기는 원본 데이터로부터 유도되므로, MRN은 과거 데이터에 대한 의존도를 효과적으로 줄이고, IL의 핵심 과제인 치명적 망각(catastrophic forgetting)을 보다 효과적으로 완화한다. 우리는 MLT17 및 MLT19 데이터셋을 기반으로 MRN의 광범위한 평가를 수행하였으며, 다양한 설정에서 기존의 일반적인 IL 방법 대비 평균 정확도 향상 폭이 10.3%에서 35.8%에 이르는 등 뚜렷한 성능 우위를 보였다. 코드는 https://github.com/simplify23/MRN 에서 공개되어 있다.