11日前
弱教師付きコントラスト学習
Mingkai Zheng, Fei Wang, Shan You, Chen Qian, Changshui Zhang, Xiaogang Wang, Chang Xu

要約
教師なし視覚表現学習は、対照学習(contrastive learning)の近年の進展により、コンピュータビジョン分野において大きな注目を集めている。既存の多くの対照学習フレームワークは、インスタンス識別(instance discrimination)を事前学習タスクとして採用しており、各個々のサンプルを異なるクラスとして扱う。しかし、このようなアプローチは必然的にクラス衝突(class collision)問題を引き起こし、学習された表現の品質を損なう。この問題に着目し、弱教師付き対照学習フレームワーク(Weakly Supervised Contrastive Learning, WCL)を提案する。本手法では、二つの投影ヘッド(projection head)を用いる。一方のヘッドは従来のインスタンス識別タスクを実行する。他方のヘッドは、グラフに基づく手法を用いて類似するサンプルを探索し、弱いラベル(weak label)を生成し、そのラベルに基づいて弱教師付き対照学習を実施することで、類似画像間の距離を縮める。さらに、K近傍(K-Nearest Neighbor)に基づくマルチクロップ戦略を導入し、ポジティブサンプルの数を拡張する。広範な実験結果により、WCLがさまざまなデータセットにおいて自己教師付き表現の品質を向上させることを示した。特に、半教師付き学習において、新たな最良性能(state-of-the-art)を達成した。ResNet50を用いた場合、ラベル付きサンプルが1%および10%のわずかな割合でも、ImageNet Top-1精度がそれぞれ65%および72%に達し、ResNet101を用いたSimCLRv2を上回る結果を獲得した。