11日前

時間行動セグメンテーションのための境界認識型カスケードネットワーク

{Li-Min Wang, Gangshan Wu, Ziteng Gao, Zhifeng Li, Zhenzhi Wang}
時間行動セグメンテーションのための境界認識型カスケードネットワーク
要約

トリムされていない動画における人間の行動セグメントの同定は、境界の曖昧さや過剰なセグメンテーションという課題により、依然として困難な問題である。本研究では、これらの課題に対処するため、2つの新規な構成要素を導入した境界意識型のカスケードネットワークを提案する。まず、モデルが曖昧なフレームに対して適応的な受容 field を持つとともに、より信頼性の高い予測が可能となる新たなカスケード設計法、すなわち「ステージカスケード(Stage Cascade)」を提案する。次に、意味的な境界情報を活用して局所的な予測を統合する、汎用的かつ原理的な平滑化操作である「ローカルバリアープーリング(local barrier pooling)」を設計した。さらに、これらの2つの構成要素はエンドツーエンドの学習フレームワーク上で共同で微調整可能である。本研究では、50Salads、GTEA、Breakfastの3つの難易度の高いデータセットを用いた実験により、提案手法が現在の最先端手法を顕著に上回ることを示した。コードは https://github.com/MCG-NJU/BCN で公開されている。

時間行動セグメンテーションのための境界認識型カスケードネットワーク | 最新論文 | HyperAI超神経