11일 전

제로샷 액션 인식을 위한 오류 수정 출력 코드

{Fumin Shen, Ling Shao, Bingbing Ni, Jie Qin, Yunhong Wang, Li Liu, Jiaxin Chen}
제로샷 액션 인식을 위한 오류 수정 출력 코드
초록

최근 행동 카테고리의 급격한 증가에 따라 제로샷 행동 인식(ZSAR)이 부상하고 있다. 본 논문에서는 오류 보정 출력 부호(Error-Correcting Output Codes, ECOC)를 활용하여 ZSAR를 새로운 관점에서 탐구한다. 제안하는 ZSECOC는 기존 ECOC에 제로샷 행동 인식 기능을 추가함으로써 도메인 시프트 문제를 해결함으로써, 기존 ECOC의 장점을 유지하면서도 도메인 시프트를 효과적으로 극복한다. 특히, ZSECOC는 보이는 카테고리에 대해 카테고리 수준의 의미 정보와 데이터의 내재적 구조를 동시에 고려하여 구분 능력 있는 표현을 학습한다. 이 과정에서 보이는 카테고리 간에 잘 정립된 상관관계를 보이지 않는 카테고리로 전이함으로써 도메인 시프트 문제를 간접적으로 해결한다. 또한, 보이는 카테고리의 학습된 임베딩을 보이지 않는 카테고리의 내재적 구조에 더 잘 적합하도록 하는 간단한 의미 전이 전략을 제안한다. 그 결과, ZSECOC는 ECOC의 유망한 특성을 계승하면서도 도메인 시프트 문제를 극복하여 ZSAR에 있어 더욱 구분 능력 있는 모델이 된다. 제안한 방법은 올림픽 스포츠, HMDB51, UCF101 등 세 가지 실제 행동 인식 벤치마크에서 체계적으로 평가되었으며, 실험 결과는 기존 최고 수준의 방법들에 비해 ZSECOC의 우수성을 명확히 입증한다.

제로샷 액션 인식을 위한 오류 수정 출력 코드 | 최신 연구 논문 | HyperAI초신경