11日前
EpO-Net:密集トラジェクトリーデータにおける幾何制約を活用したモーションサリエンシーの検出
Muhammad Faisal, Ijaz Akhter, Mohsen Ali, Richard Hartley

要約
既存の顕著な運動セグメンテーション手法は、幾何学的特徴を明示的に学習できず、特に静止物体に対して誤検出を起こしやすいという課題がある。本研究では、多視点幾何制約を活用することでこうした欠点を回避する。また、海など非剛体な背景を扱うために、運動特徴と外見特徴の間に堅牢な融合機構を提案する。動画内のすべての画素をカバーする密な軌道(dense trajectories)を導入し、それらに基づく「軌道に基づくエピポーラ距離(trajectory-based epipolar distances)」を定義することで、背景領域と前景領域を区別する手法を提案する。このエピポーラ距離はデータに依存せず、画像間の少数の特徴点対応関係が与えられれば容易に計算可能である。本研究では、エピポーラ距離と光流(optical flow)を組み合わせることで、強力な運動ネットワークを学習できることを示す。この2つの特徴をネットワークが同時に活用できるようにするため、シンプルな機構である「入力ドロップアウト(input-dropout)」を提案する。運動特徴のみを用いたネットワークと比較して、DAVIS-2016データセットにおいて平均IoUスコアで従来の最先端手法を5.2%上回ることを実証した。さらに、入力ドロップアウト機構を用いて運動ネットワークと外見ネットワークを堅牢に融合することで、DAVIS-2016、DAVIS-2017、SegTrackv2の各データセットにおいても、既存の手法を上回る性能を達成した。