
要約
近年、物体検出分野において顕著な進展が見られても、少量のデータ環境下で効果的な検出器を訓練することは依然として未解決の課題である。物体検出用の訓練データのラベル付けは極めて高コストであり、限られたラベル付きデータから良好な汎化性能を発揮する手法の開発が強く求められている。本研究では、アノテーション付きデータが限定的な状況下での物体検出、すなわち「少数回学習(few-shot object detection)」という問題に着目する。近年注目されているメタラーニングの原理に基づき、本研究では「Meta-RCNN」と呼ばれる新たなメタラーニングフレームワークを提案する。このフレームワークは、メタラーニングを通じて少数回検出能力を学習することを目的としている。具体的には、Meta-RCNNは(メタ)訓練データ上でエピソード学習(episodic learning)の枠組みで物体検出器を学習する。この学習方式により、Meta-RCNNは新しいタスクに対して少数のラベルデータで検出を行うための事前知識(prior)を獲得することができる。Faster RCNNモデルを基盤として構築されたMeta-RCNNでは、領域提案ネットワーク(RPN)と物体分類ブランチの両方がメタラーニングによって学習される。メタトレーニングされたRPNは、クラス固有の領域提案を生成する能力を学び、物体分類器は少数回分類を行う能力を習得する。Meta-RCNNの新規な損失関数と学習戦略は、エンドツーエンド(end-to-end)で学習可能である。本研究では、Pascal VOCデータセット上における少数回検出の課題に対してMeta-RCNNの有効性を実証し、有望な結果を達成した。