Temporal Sentence Grounding
시간 문장 정렬(TSG)은 주어진 자연어 쿼리를 통해 자르지 않은 비디오에서 특정 순간을 찾는 컴퓨터 비전 분야의 하위 작업입니다. 이 작업은 비디오 수준의 행동 범주, 몇 개의 타임스탬프가 있는 행동 주석, 그리고 자르지 않은 비디오에 모든 행동 범주와 시간 구간이 주석으로 달린 경우와 같이 다양한 수준의 감독 정보를 활용하여 위치 추정의 정확성과 일반화 능력을 향상시키는 데 중점을 둡니다. TSG는 비디오 검색, 콘텐츠 이해, 인간-컴퓨터 상호작용 등에 중요한 응용 가치를 가지고 있습니다.