
要約
多くの重要なコンピュータビジョンのシナリオにおいて、ラベルの付いていないデータは豊富に存在しますが、ラベルは希少で取得が困難です。その結果、ラベルの付いていないデータを活用して教師あり分類器の性能を向上させる半教師あり学習(semi-supervised learning)が最近の文献で大きな注目を集めています。半教師あり学習アルゴリズムの中でも代表的なものとして、共訓練(co-training)アルゴリズムがあります。共訓練アルゴリズムでは、異なる独立したかつ十分な表現や「視点」を持つ2つの異なるモデルが共同でより良い予測を行うことができます。これらの各モデルは、ラベルの付いていないデータポイントに対して疑似ラベル(pseudo-labels)を作成し、他のモデルの性能向上に利用します。独立した視点が利用できない一般的な場合でも、事前学習済みモデルを使用することで安価にこのような視点を構築することができます。構築された視点での共訓練は、個々に構築した視点よりも性能を向上させ、最近の半教師あり学習アプローチと同等の性能を達成します。私たちはメタ共訓練(Meta Co-Training)という新しい半教師あり学習アルゴリズムを提案します。この方法には以下の2つの利点があります。(i) 異なる視点間での情報量の差が大きい場合でも学習がより堅牢であり、(ii) 各反復ごとに最初から再学習する必要がないことです。私たちの手法はImageNet-10%において先行研究よりも約4.7%の誤り率削減を達成し、新たな最先端性能を示しています。また、他のいくつかの細かい画像分類データセットにおいても、先行する半教師あり学習研究を上回る性能を発揮しています。