7일 전

축구 영상에서 이벤트의 실시간 탐지에 관한 3차원 컨볼루션 신경망 적용

{Pal Halvorsen, Michael A. Riegler, Dag Johansen, Evi Zouganeli, Hakon K. Stensland, Vajira Thambawita, Steven A. Hicks, Olav A. Nergard Rongved}
축구 영상에서 이벤트의 실시간 탐지에 관한 3차원 컨볼루션 신경망 적용
초록

본 논문에서는 3차원 컨볼루션 신경망을 활용하여 축구 영상에서 이벤트를 자동으로 탐지하는 알고리즘을 제안한다. 이 알고리즘은 목표 이벤트(골, 경고카드, 교체 등)를 탐지하기 위해 슬라이딩 윈도우 방식을 사용하여 주어진 영상 전체를 스캔한다. 제안된 방법은 SoccerNet의 세 가지 서로 다른 데이터셋과 스웨덴 올스벤칸, 노르웨이 엘리테세리엔의 데이터셋을 대상으로 검증되었다. 전체적으로 실험 결과, 높은 리콜률, 낮은 지연 시간, 정확한 시점 추정이 가능함을 확인할 수 있었다. 단, 현재 최고 수준의 기술과 비교했을 때 정밀도는 다소 낮은 편이지만, 이는 더 높은 지연 시간을 수반하며, 시점 추정의 정확도가 다소 낮아도 허용 가능한 경우에 성능이 우수한 기존 기법과의 타협점이다. 본 논문에서는 제안된 알고리즘 외에도, 학습 파이프라인의 각 구성 요소가 최종 성능에 미치는 영향을 철저히 분석하기 위한 광범위한 아블레이션 연구를 수행하였다.

축구 영상에서 이벤트의 실시간 탐지에 관한 3차원 컨볼루션 신경망 적용 | 최신 연구 논문 | HyperAI초신경