
초록
일반화된 제로샷 학습(GZSL)은 훈련 중에 보지 못한 객체를 인식할 수 있는 능력 덕분에 컴퓨터 비전 분야에서 중요한 연구 영역으로 부상하고 있습니다. 생성 기법이 전통적인 GZSL을 완전히 지도 학습으로 변환하는 데 있어 상당한 진전을 이루었음에도 불구하고, 이러한 기법들은 종종 불필요한 많은 합성 특성을 생성하여 훈련 시간을 증가시키고 정확도를 감소시키는 경향이 있습니다. 이 문제를 해결하기 위해 본 논문에서는 강화 학습을 활용한 합성 특성 선택의 새로운 접근 방식을 제안합니다. 특히, 본 연구에서는 근사 정책 최적화(PPO)를 통해 훈련된 트랜스포머 기반 선택기를 제안합니다. 이 선택기는 보지 못한 클래스의 검증 분류 정확도를 보상으로 사용하여 합성 특성을 선택합니다. 제안된 방법은 모델 독립적이고 데이터 독립적이어서 이미지와 동영상 모두에 적용할 수 있으며 다양한 응용 분야에서 유연하게 활용될 수 있습니다. 실험 결과, 제안된 접근 방식이 기존의 특성 생성 방법보다 우수함을 입증하였으며, 여러 벤치마크에서 개선된 전체 성능을 보여주었습니다.