18日前

動的コンテキスト感受性フィルタリングネットワークによる動画顕著オブジェクト検出

{Zhongxuan Luo, Huchuan Lu, Jingjing Li, Wei Ji, Shunyu Yao, Yongri Piao, Yifei Wang, Jie Liu, Miao Zhang}
動的コンテキスト感受性フィルタリングネットワークによる動画顕著オブジェクト検出
要約

フレーム間の動的変化を捉える能力は、動画顕著対象検出(VSOD)の発展において極めて重要である。多くの研究がこの分野で著しい成果を上げているものの、その動的性質に対するより深い理解が今後求められている。本研究では、以下の問いに答えることを目的とする:モデルは現実世界の微細な違いを捉えながら、どのように動的変化に適応し自己調整できるか?また、時間経過に伴い、時系列的な動的特性が空間情報にどのように適切に統合されるか?この目的の下、動的コンテキストに敏感なフィルタリングモジュール(DCFM)と効果的な双方向動的融合戦略を備えた、動的コンテキストに敏感なフィルタリングネットワーク(DCFNet)を提案する。提案するDCFMは、連続フレーム間の位置依存性の類似性を抽出することで、動的フィルタ生成の新たな視点を提供する。また、双方向動的融合戦略により、空間情報と時系列情報の間の動的な相互作用が促進される。実験結果から、本手法は多数のVSODデータセットにおいて最先端の性能を達成するとともに、リアルタイムでの処理速度(28 fps)を維持できることを示した。ソースコードは、https://github.com/OIPLab-DUT/DCFNet にて公開されている。