Active Speaker Localization
Active Speaker Localization (ASL)는 환경에서 활성화된 발화자를 공간적으로 위치시키는 과정으로, 오디오, 비주얼, 또는 두 모드의 조합을 사용합니다. 이 기술의 목적은 발화자의 위치를 정확히 파악하여 멀티모달 상호작용 시스템의 성능을 향상시키는 것입니다. ASL은 회의 시스템, 지능형 감시, 인간-컴퓨터 상호작용 등의 분야에서 중요한 응용 가치를 가지고 있으며, 시스템의 인식 능력과 사용자 경험을 개선할 수 있습니다.