2달 전
클러스터 기반의 시간적 맥락 인식을 활용한 비디오 요약
Hai-Dang Huynh-Lam; Ngoc-Phuong Ho-Thi; Minh-Triet Tran; Trung-Nghia Le

초록
본 논문에서는 TAC-SUM이라는 새로운 효율적인 학습이 필요하지 않은 비디오 요약 방법을 제시합니다. 이 방법은 시간적 맥락을 통합하여 기존의 클러스터 기반 모델의 한계를 해결합니다. 우리의 방법은 클러스터링 정보를 사용하여 입력 비디오를 시간적으로 연속된 세그먼트로 분할함으로써, 클러스터링 과정에 시간 인식을 주입할 수 있게 합니다. 이는 이전의 클러스터 기반 요약 방법과 차별화됩니다. 이렇게 생성된 시간 인식 클러스터는 간단한 규칙을 통해 키프레임 선택과 프레임 중요도 점수 계산을 수행하여 최종 요약을 생성하는 데 활용됩니다. SumMe 데이터셋에서 수행된 실험 결과는 제안된 접근 방식의 효과성을 입증하며, 기존의 비지도 학습 방법보다 우수한 성능을 보여주고 최신 지도 학습 요약 기술과 유사한 성능을 달성하였습니다. 소스 코드는 \url{https://github.com/hcmus-thesis-gulu/TAC-SUM}에서 참조용으로 제공됩니다.