12日前
スイントランスフォーマーを用いた鳥類の小物体検出
{Ichiro Ide, Takahiro Komamizu, Takatsugu Hirayama, Yasutomo Kawanishi, TingWei Liu, Marc A. Kastner, Da Huo}
要約
オブジェクト検出は、画像内のオブジェクトを検出するタスクである。このタスクにおいて、小型オブジェクトの検出は特に困難である。サイズが小さいという特徴に加えて、ぼやけや遮蔽(オクルージョン)などの要因も検出を難しくしている。現在の小型オブジェクト検出手法は、人群における歩行者やリモートセンシングにおける遠方オブジェクトなど、小型かつ密集した状況に特化している。しかし、対象オブジェクトが小型かつ疎である場合、学習に利用可能なオブジェクトが不足するため、有効な特徴を学習することがさらに困難となる。本研究では、特定の小型オブジェクトカテゴリである「鳥」の検出に特化した手法を提案する。特に、バックボーンと予測ヘッドの間にあるネック(サブネットワーク)が学習する特徴を、階層的設計によりより効果的な特徴に改善することを目的とする。本手法では、Swin Transformerを用いて画像特徴をアップサンプリングし、小型オブジェクトに適応するため、シフトウィンドウサイズを調整している。実験の結果、Swin TransformerをベースとするネックとCenterNetを組み合わせることで、ウィンドウサイズを調整することにより良好な性能が得られることを確認した。さらに、より小さいウィンドウサイズ(デフォルト値2)が小型オブジェクト検出におけるmAPに有利であることが明らかになった。