12日前
メタ畳み込みニューラルネットワークを用いた単一ドメイン一般化
{Xian-Sheng Hua, Jianqiang Huang, Feng Gao, Xinmei Tian, Zhiheng Yin, Yonggang Zhang, Xu Shen, Chaoqun Wan}

要約
単一ドメイン一般化(single domain generalization)では、ある1つのドメインからのデータのみで訓練されたモデルが、複数の未知のドメインにおいても良好な性能を発揮する必要がある。本論文では、画像認識における単一ドメイン一般化問題を解決するため、新しいモデル「メタ畳み込みニューラルネットワーク(meta convolutional neural network)」を提案する。本手法の核心的なアイデアは、画像の畳み込み特徴量を「メタ特徴量(meta features)」に分解することである。メタ特徴量は、言語における「語」が文書表現の基本単位となるように、画像表現の普遍的かつ基本的な視覚的要素として定義される。すなわち、「視覚的単語」として機能する。このメタ特徴量を参照基準として、局所的な畳み込み特徴量に含まれる関係のない情報をアドレス指定プロセスによって排除し、その後、関連するメタ特徴量の組み合わせとして畳み込み特徴マップを再構成する合成操作を提案する。このようにすることで、未知ドメインからのバイアスを含まずに画像を普遍的に符号化でき、ソースドメインで訓練された後続モジュールによって処理が可能となる。合成操作はオンラインバッチ学習の形で、回帰分析手法を用いてメタ特徴量を学習する。複数のベンチマークデータセットにおける広範な実験により、本手法が単一ドメイン一般化能力の向上において優れた性能を発揮することが確認された。