
本研究の主な目的は、前述の問題に対して複数の解決策を提示することである。そのために、これまでの最先端手法を分析し、正常パターンと異常パターンを捉えるために用いられている概念について包括的な概観を提供することで、その理解を明確化する。さらに、さまざまな戦略を検討した結果、最先端の性能を一貫して向上させる新たなアプローチの開発に成功した。また、本研究では、特定の異常検出イベントに焦点を当て、格闘シーンの多様性が広く反映された、フレーム単位で完全にアノテーションされた大規模かつ世界初のデータセットの公開を発表する。このデータセットは研究コミュニティにより自由に利用可能である。本論文では、最小限の監視(minimal supervision)を前提とした2つの提案手法を紹介する。第一の手法は、近年注目されている自己教師学習(self-supervised learning)技術を活用し、手作業によるアノテーションという煩雑な作業を回避するものである。訓練データは、2つの独立したエキスパートがベイズ枠組みを通じて相互にデータを供給する反復学習フレームワークによって自動的にラベル付けされる。第二の手法は、弱教師ラベル付きの動画を活用して、複数インスタンス学習(multiple instance learning)の枠組みにおいて異常度順序モデルを学習する新規アプローチである。この場合、ラベル付けは動画単位で行われる。実験は複数の代表的なデータセットで実施され、本研究の提案手法はすべてにおいて最先端の手法を明確に上回る性能を示した。さらに、概念実証(proof-of-concept)として、異なる環境下で収集した実世界シミュレーションデータを用いたフィールドテストの結果も報告している。これにより、学習したモデルの実環境における有効性を検証した。