17일 전

표준 CDVA에서 비디오 검색을 향상시키기 위한 시계적 신호 탐색

{Yukyung Choi, Joungil Yun, Joonsoo Kim, Guentaek Lim, Won Jo}
초록

대규모 영상 분석에 대한 수요가 증가함에 따라 영상 검색 연구도 활발해지고 있다. 2014년 ISO/IEC MPEG는 영상 분석을 위한 컴팩트 기술자(Compact Descriptors for Video Analysis, CDVA)를 표준화하기 시작하였으며, 현재 이는 공식 표준으로 채택되어 있다. 그러나 CDVA 표준은 성능 검증에 사용되는 MPEG-CDVA 데이터셋이 공개되지 않았기 때문에 다른 기법들과의 비교가 쉽지 않은 실정이며, 현재 여러 버전의 CDVA 실험 모델을 기반으로 후속 연구가 진행 중이다. 또한 기존 연구에서는 CDVA 프레임워크를 구성하는 모듈들의 분석이 부족한 실정이다. 따라서 본 연구에서는 각 모듈이 검색 작업에 미치는 영향을 분석하기 위해 CDVA에 대해 자체 평가를 수행한다. 더불어 이러한 자체 평가를 통해 발견한 한계를 극복하기 위해, 시간적 중첩 불변성 풀링(Temporal Nested Invariance Pooling, TNIP)을 제안한다. TNIP는 CDVA의 특징 중 하나인 중첩 불변성 풀링(Nested Invariance Pooling, NIP)의 성능을 개선함으로써 시간적 강건성(Temporal Robustness)을 달성하는 개념을 의미한다. 마지막으로, 기존 CDVA와 제안된 방법의 성능을 여러 공개 데이터셋을 기반으로 벤치마킹하였다. 이를 통해 제안된 방법을 활용할 경우 CDVA 프레임워크가 검색 성능을 향상시킬 수 있음을 입증하였다.