Command Palette
Search for a command to run...
シンプルなコピーペーストはインスタンスセグメンテーションにおける強力なデータ拡張手法である
シンプルなコピーペーストはインスタンスセグメンテーションにおける強力なデータ拡張手法である
Golnaz Ghiasi Yin Cui Aravind Srinivas Rui Qian Tsung-Yi Lin Ekin D. Cubuk Quoc V. Le Barret Zoph
概要
インスタンスセグメンテーションモデルにおいて、データ効率性を高め、希少なオブジェクトカテゴリを適切に処理できるようにすることは、コンピュータビジョン分野における重要な課題である。データ拡張(data augmentation)を活用することは、この課題に対処する有望なアプローチの一つである。本研究では、インスタンスセグメンテーションにおけるCopy-Paste拡張法([13, 12])について体系的な検討を行った。この手法は、ランダムにオブジェクトを画像上に貼り付けるものである。これまでのCopy-Pasteに関する先行研究では、オブジェクトを貼り付ける際に周囲の視覚的文脈をモデル化する必要があるとされてきた。しかし、本研究では、単純にオブジェクトをランダムに貼り付けるというメカニズムでも十分な性能が得られ、強力なベースラインモデルに対して顕著な向上をもたらすことを示した。さらに、擬似ラベル(pseudo labeling)を用いて追加データを活用する半教師付き学習手法(例:セルフトレーニング)と組み合わせた場合、Copy-Pasteは加算的に効果を発揮することを明らかにした。COCOインスタンスセグメンテーションベンチマークにおいて、マスクAPは49.1、ボックスAPは57.3を達成し、従来の最先端手法と比較して、マスクAPで+0.6、ボックスAPで+1.5の向上を実現した。さらに、LVISベンチマークにおいてもCopy-Pasteが顕著な性能向上をもたらすことを実証した。我々のベースラインモデルは、希少カテゴリにおいてLVIS 2020チャレンジ優勝エントリーよりもマスクAPで+3.6高い性能を達成した。