11日前
VDDT:変形トランスフォーマを用いた船舶検出の改善
{Lefan Wang, Zhihui Chen, Ruixin Zheng, Jinhe Su, Yiling Liu, Siyu Chen}
要約
船舶検出は物体検出分野において広く注目されており、最近提案されたDETRは、真正のエンドツーエンド物体検出を実現し、優れた性能を示している。しかし、DETRは小型物体の検出に対して感度が低く、船舶検出においては満足のいく性能を発揮できないという課題がある。本研究では、Deformable DETRをベースラインモデルとして採用し、その上に改良を加えた。まず、オブジェクトクエリに参照点の情報を追加することで、オブジェクトクエリが学習する特徴を豊かにし、検出器の性能を向上させた。次に、デコーダの計算負荷を軽減するため、マルチヘッド自己注意機構(multi-head self-attention)の代わりにマルチレイヤーパーセプトロン(multi-layer perceptron)を用いた。さらに、4563枚の画像を含む85本の動画を収集し、これらの画像を活用して船舶用データセットを構築した。当該データセットを用いた実験結果から、提案手法VDDTがベースラインモデルに対して優れた性能を示したことが確認された。