13일 전

일반화된 게임 표현의 대조 학습

Chintan Trivedi, Antonios Liapis, Georgios N. Yannakakis
일반화된 게임 표현의 대조 학습
초록

게임을 픽셀 단위로 표현하는 방식은 일반적이고 유연한 게임 모델을 구축하는 데 있어 유망한 접근법을 제공한다. 게임은 단순한 이미지가 아니지만, 게임 픽셀을 기반으로 학습된 신경망 모델은 보통 게임의 시각적 스타일의 차이를 포착하는 데 그치며, 게임의 본질적인 내용은 무시하게 된다. 그 결과, 같은 장르 내에서도 유사한 게임 간에 일반화가 잘 되지 않는다. 본 연구에서는 최근의 대조 학습(contrastive learning) 기술의 발전을 바탕으로, 게임의 표현 학습에서 이 기법의 장점을 입증한다. 게임 이미지 간의 대조를 학습함으로써, 게임을 더 효율적으로 분류할 뿐만 아니라, 시각적 스타일에 주목하지 않고 게임의 내용에 집중함으로써 더 의미 있는 방식으로 게임을 구분하는 모델을 도출할 수 있다. 175개의 게임과 10개의 장르를 포함하는 총 10만 장의 스포츠 비디오 게임 이미지로 구성된 대규모 데이터셋을 활용한 실험 결과, 기존의 감독 학습 방식에 비해 대조 학습이 보다 일반화된 게임 표현을 학습하는 데 더 적합함을 확인하였다. 본 연구의 발견은, 사전에 접한 적 없는 게임에도 재사용이 가능하면서 재학습이나 미세 조정 없이 활용할 수 있는 보편적인 시각 인코더(visual encoder)의 실현에 한 걸음 더 가까워지게 한다.