11日前
SimMatchV2:グラフ整合性を用いた準教師付き学習
Mingkai Zheng, Shan You, Lang Huang, Chen Luo, Fei Wang, Chen Qian, Chang Xu

要約
半教師あり画像分類は、コンピュータビジョンにおける最も基本的な課題の一つであり、人的労力の大幅な削減を可能にする。本論文では、ラベル付きデータとラベルなしデータの間における多様な一貫性正則化をグラフの観点から定式化する新しい半教師あり学習アルゴリズム、SimMatchV2を提案する。SimMatchV2では、サンプルの増強ビューをノードとして捉え、各ノードはラベルとその対応する表現から構成される。異なるノードは、ノード表現の類似度によって測定されたエッジで接続される。グラフ理論におけるメッセージ伝達およびノード分類のアイデアに着想を得て、4種類の一貫性、すなわち1) ノード-ノード一貫性、2) ノード-エッジ一貫性、3) エッジ-エッジ一貫性、4) エッジ-ノード一貫性を提案する。また、単純な特徴量正規化が異なる増強ビュー間の特徴量ノルムの差を著しく低減できることを明らかにし、SimMatchV2の性能向上に寄与することを示した。本手法は複数の半教師あり学習ベンチマークにおいて検証された。特に、ResNet-50をバックボーンとし、300エポックの学習を行った場合、ImageNetデータセットにおいてラベル付きサンプルが1%および10%の条件下で、それぞれ71.9%および76.2%のTop-1精度を達成し、従来の手法を大きく上回り、最先端の性能を実現した。コードおよび事前学習済みモデルは、\href{https://github.com/mingkai-zheng/SimMatchV2}{https://github.com/mingkai-zheng/SimMatchV2} にて公開されている。