17일 전

시간 행동 분할을 위한 효율적인 두 단계 네트워크

{Shenglan Liu, YuHan Wang, Li Xu, Jie Zhu, Lianyu Hu, Lin Feng, Kaiyuan Liu, Zhuben Dong, Yunheng Li}
초록

경계 모호성과 과도한 분할 문제로 인해 긴 트림되지 않은 영상에서 모든 프레임을 식별하는 것은 여전히 도전적인 과제이다. 이러한 문제를 해결하기 위해 우리는 두 가지 구성 요소로 이루어진 효율적인 두 단계 네트워크(Efficient Two-Step Network, ETSN)를 제안한다. ETSN의 첫 번째 단계는 국소적이고 전역적인 프레임 수준의 특징을 동시에 추출하여 분할 경계를 정확히 예측하는 효율적인 시간적 시리즈 피라미드 네트워크(Efficient Temporal Series Pyramid Networks, ETSPNet)이다. 두 번째 단계는 새로운 비지도 학습 기법인 국소 버르 억제(Local Burr Suppression, LBS)로, 과도한 분할 오류를 크게 감소시킨다. 50Salads, GTEA, Breakfast 데이터셋을 포함한 다양한 벤치마크에서 수행한 실험 결과에 따르면, ETSN은 현재 최고 수준의 기법들보다 큰 성능 차이로 우수한 성능을 보였다.