
深層学習は、画像中の物体検出タスクに対して効果的な解決策として登場したが、その代償として大規模なラベル付きデータセットの必要性が生じている。このコストを軽減するために、豊富なラベルなしデータを活用する半教師付き物体検出手法が提案されており、すでに顕著な成果を示している。しかしながら、これらの手法の多くは、仮ラベル(pseudo-label)を真のラベル(ground-truth)オブジェクトに結びつけるために閾値(threshold)を用いる必要がある。従来の研究では、この閾値は通常経験的に決定されており、時間のかかるプロセスであり、また単一のデータ分布に対してのみ行われている。データ分布が変化する(たとえばドメインが変わると)、新たな高コストなパラメータ探索が必要となる。本研究では、物体検出における適応的自己学習法(Adaptive Self-Training for Object Detection: ASTOD)を提案する。ASTODは、シンプルでありながら効果的な教師-生徒型アプローチであり、スコアヒストグラムの真の値に基づいて、コストをかけずに閾値を自動的に決定する。また、教師モデルの予測品質を向上させるために、新たな仮ラベル付与手順を提案する。この手順では、ラベルなし画像に対して異なる視点(view)を用いることで、見逃し予測の数を低減し、より優れた候補ラベルを獲得する。本手法では、教師モデルと生徒モデルを別々に訓練し、教師モデルを生徒モデルに置き換えることで、反復的な学習が可能となる。MS-COCOデータセットにおける実験では、閾値パラメータを必要としない最先端手法と比較しても一貫して優れた性能を示し、パラメータスイープ探索を要する手法と比べても競争力のある結果を達成した。衛星画像を含むDIORデータセットにおける教師ありベースラインとの追加実験からも同様の結論が得られ、データ分布に依存せずにスコア閾値を自動的に適応可能であることが実証された。コードは以下のURLで公開されている:https://github.com/rvandeghen/ASTOD