8日前
対照正則化U-Netを用いた動画異常検出
{Joon Huang Chuah, Maylor Karhang Leung, Hui-Fuang Ng, Hung-Khoon Tan, Yu Tong Cheng, Kian Yu Gan}
要約
ビデオ異常検出は、ビデオ内の異常なセグメントを特定することを目的としている。通常、弱教師ありのビデオレベルラベルを用いて学習が行われる。本論文では、ビデオ異常検出モデルの性能に影響を与える2つの重要な要因に着目する。第一に、局所的およびグローバルな時系列依存性をより効果的に捉える方法について検討する。従来のアーキテクチャは、局所的またはグローバルな情報をそれぞれ効果的に捉えることができるが、両者を同時に扱うことは困難であった。そこで、エンコーダが局所的な依存性を基に階層的にグローバルな依存性を学習し、デコーダがそのグローバル情報をセグメントレベルへと逆伝播することで分類を行う、統一的な構造としてU-Netに類似したアーキテクチャを提案する。第二に、限られた訓練データのため、過学習はビデオ異常検出において顕著な課題である。これを解決するために、特徴ベースの弱教師あり対比正則化を提案する。この正則化手法は、クラス間の分離性とクラス内の一貫性を強制することで、より汎化性の高い特徴を学習することを目的としている。UCF-Crimeデータセットにおける広範な実験の結果、本手法は複数の最先端手法を上回る性能を示した。