2달 전

TransNet V2: 빠른 샷 전환 검출을 위한 효과적인 딥 네트워크 아키텍처

Souček, Tomáš ; Lokoč, Jakub
TransNet V2: 빠른 샷 전환 검출을 위한 효과적인 딥 네트워크 아키텍처
초록

자동 샷 전환 검출 방법은 이미 20년 이상 연구되어 왔지만, 효과적인 보편적인 인간 수준의 모델은 아직 제안되지 않았습니다. 하드 컷이나 간단한 점진적 변화와 같은 일반적인 샷 전환조차도 분석 대상이 되는 비디오 콘텐츠의 잠재적 다양성이 여전히 오검출과 누락을 초래할 수 있습니다. 최근에는 3D 합성곱 구조와 인공적으로 생성된 훈련 데이터를 사용하여 딥 러닝 기반 접근법이 샷 전환 검출의 정확성을 크게 향상시켰습니다. 그러나 100% 정확도는 여전히 달성하기 어려운 이상적인 목표입니다. 본 논문에서는 존경받는 벤치마크에서 최고 성능을 달성하는 우리의 딥 네트워크 TransNet V2의 현재 버전을 공유합니다. 훈련된 모델의 인스턴스가 제공되어 커뮤니티가 대규모 비디오 아카이브를 매우 효율적으로 분석할 수 있도록 즉시 활용할 수 있습니다. 또한, 네트워크 구조와 훈련 과정에 대한 경험을 자세히 설명하며, 제안된 모델을 쉽게 사용하고 결과를 시각화할 수 있는 간단한 코드 조각들을 포함합니다.

TransNet V2: 빠른 샷 전환 검출을 위한 효과적인 딥 네트워크 아키텍처 | 최신 연구 논문 | HyperAI초신경