2ヶ月前
WOAD: 未編集ビデオにおける弱教師ありオンラインアクション検出
Gao, Mingfei ; Zhou, Yingbo ; Xu, Ran ; Socher, Richard ; Xiong, Caiming

要約
未編集動画におけるオンラインアクション検出は、アクションが発生する瞬間にそれを識別することを目指しており、リアルタイムアプリケーションにとって非常に重要です。従来の手法は、訓練のために時間的なアクション境界の煩雑なアノテーションに依存しており、これがオンラインアクション検出システムのスケーラビリティを阻害していました。本研究では、WOAD(Weakly-supervised Online Action Detection)と呼ばれる弱教師ありフレームワークを提案します。このフレームワークには、時間的プロポーザルジェネレータ(TPG)とオンラインアクション認識器(OAR)という2つの共同訓練モジュールが含まれています。ビデオクラスラベルによって監督されるTPGはオフラインで動作し、OAR用に正確な疑似フレームレベルラベルを抽出することを目的としています。TPGからの監督信号により、OARはオンラインでのアクション検出を行う能力を学習します。THUMOS'14、ActivityNet1.2およびActivityNet1.3での実験結果は、我々の弱教師あり手法が弱教師あり基準モデルを大幅に上回り、従来の強教師あり手法と同等の性能を達成していることを示しています。さらに、WOADは強教師ありデータが利用可能な場合にも柔軟に対応できます。強教師ありの場合、我々の手法はオンラインフレームごとのアクション認識およびアクション開始検出の両タスクにおいて最先端の結果を得ています。