9日前
MRN:インクリメンタル多言語テキスト認識のためのマルチプレックスルーティングネットワーク
Tianlun Zheng, Zhineng Chen, BingChen Huang, Wei Zhang, Yu-Gang Jiang

要約
多言語テキスト認識(MLTR)システムは、通常、固定された言語セットに焦点を当てており、新規に追加される言語の対応や、変化し続けるデータ分布への適応が困難である。本稿では、増分学習(IL)の文脈において、異なる言語がバッチ形式で順次導入される状況を想定した「増分的MLTR(IMLTR)」タスクを提案する。IMLTRは、過去のデータを記憶として保持するためのリハーサルセットにおけるサンプル文字の分布が不均一である「リハーサル不均衡」問題に直面するため、特に挑戦的である。この問題に対処するため、複数経路ルーティングネットワーク(Multiplexed Routing Network, MRN)を提案する。MRNは、現在認識対象となっている各言語に対して個別に認識器を学習する。その後、リハーサルセットに基づいて言語ドメイン予測器を学習し、各認識器に重みを付与する。認識器は元のデータから導出されるため、MRNは古いデータへの依存を効果的に低減し、ILの核心的課題である「途方もない忘却(catastrophic forgetting)」の抑制をより効果的に行う。本研究では、MLT17およびMLT19データセットを用いてMRNの広範な評価を行った。既存の汎用的なIL手法と比較して、異なる設定下で平均精度が10.3%~35.8%まで大幅に向上した。コードは https://github.com/simplify23/MRN にて公開されている。