7日前
サッカービデオにおけるイベントのリアルタイム検出:3次元畳み込みニューラルネットワークを用いた手法
{Pal Halvorsen, Michael A. Riegler, Dag Johansen, Evi Zouganeli, Hakon K. Stensland, Vajira Thambawita, Steven A. Hicks, Olav A. Nergard Rongved}

要約
本稿では、3次元畳み込みニューラルネットワーク(3D CNN)を用いたサッカービデオにおけるイベント自動検出アルゴリズムを提案する。このアルゴリズムはスライディングウィンドウ法を採用し、与えられた動画を走査することで、ゴール、イエローカード・レッドカード、選手交代などのイベントを検出する。本手法は、SoccerNet、スウェーデンのアールスベンカン(Allsvenskan)、ノルウェーのエリテセリエン(Eliteserien)の3つの異なるデータセットを用いて評価された。全体的な結果から、高いリコール、低遅延、かつ高精度なイベント発生時刻推定が実現されたことが示された。一方で、現在の最先端手法と比較すると、若干の精度の低下が見られたが、それらの手法はより高い遅延を伴い、時刻推定の精度がやや低い場合に優れた性能を発揮する。本稿では、提示したアルゴリズムに加え、学習パイプラインの各構成要素が最終的な性能に与える影響を詳細に検証するアブレーションスタディも実施している。