17日前

BoxMask:動画オブジェクト検出におけるバウンディングボックス監視の再検討

Khurram Azeem Hashmi, Alain Pagani, Didier Stricker, Muhammamd Zeshan Afzal
BoxMask:動画オブジェクト検出におけるバウンディングボックス監視の再検討
要約

本稿では、動画オブジェクト検出の性能向上を実現する新たな単純かつ効果的なアプローチを提案する。既存の手法はインスタンスレベルの特徴集約に依拠しているが、その結果、細粒度なピクセルレベルの表現が著しく無視され、類似した外観や運動特性を持つオブジェクト間で識別が困難になる傾向がある。この課題を解決するために、クラスに依存するピクセルレベルの情報を組み込むことで、識別性の高い表現を効果的に学習する「BoxMask」を提案する。本手法では、各オブジェクトに対してバウンディングボックスのアノテーションを粗いマスクとして用いるというシンプルなアプローチを採用している。提案するモジュールは、任意の領域ベースの検出器に容易に統合可能であり、検出性能の向上を実現する。ImageNet VIDおよびEPIC KITCHENSデータセットにおける広範な実験により、近年の多数の最先端手法にBoxMaskモジュールを組み込むことで、一貫して顕著な性能向上が確認された。

BoxMask:動画オブジェクト検出におけるバウンディングボックス監視の再検討 | 最新論文 | HyperAI超神経