8日前

マルチソースドメイン適応におけるメタ自己学習:ベンチマーク

Shuhao Qiu, Chuang Zhu, Wenli Zhou
マルチソースドメイン適応におけるメタ自己学習:ベンチマーク
要約

近年、深層学習に基づく手法はコンピュータビジョン分野において有望な成果を上げている。しかし、一般的な深層学習モデルは大量のラベル付きデータを必要とし、その収集とラベリングは人的労力が非常にかかる。さらに、学習データとテストデータのドメインシフト(domain shift)によりモデルの性能が著しく低下するリスクも存在する。テキスト認識はコンピュータビジョン分野で広く研究されている分野であり、フォントの多様性や複雑な背景の存在により、上記の問題に直面している。本論文では、テキスト認識問題に焦点を当て、この課題に対応するための主に3つの貢献を行う。第一に、テキスト認識用のマルチソースドメイン適応データセットを構築した。本データセットは5つの異なるドメインを含み、500万枚以上の画像を収録しており、現時点で知られている限り、初めてのマルチドメインテキスト認識データセットである。第二に、自己学習(self-learning)手法とメタ学習(meta-learning)の枠組みを統合した新規手法「Meta Self-Learning」を提案した。この手法はマルチドメイン適応の状況下でも優れた認識性能を達成した。第三に、提案手法の有効性を検証するため、本データセット上で広範な実験を実施し、基準(benchmark)を提供した。本研究のコードおよびデータセットは、近日中に https://bupt-ai-cz.github.io/Meta-SelfLearning/ にて公開予定である。

マルチソースドメイン適応におけるメタ自己学習:ベンチマーク | 最新論文 | HyperAI超神経