초록
다수의 다중 에이전트 시공간 시스템에서 에이전트들은 공유되지만 관찰되지 않은 변수(예: 농구 경기에서 팀이 실행하는 플레이)의 영향을 받아 작동합니다. 그 결과, 각 시간 단계에서 에이전트들의 궤적은 종종 통계적으로 의존적이게 됩니다. 그러나 대부분의 다중 에이전트 모델은 각 시간 단계에서 에이전트들의 궤적이 통계적으로 독립적이라고 암시적으로 가정하고 있습니다. 본 논문에서는 baller2vec++이라는 다중 실체 트랜스포머를 소개하는데, 이는 협력적인 에이전트들을 효과적으로 모델링할 수 있습니다. 구체적으로, baller2vec++는 위치와 "미리보기" 궤적 시퀀스의 혼합에 특별히 설계된 자기 주의 마스크(self-attention mask)를 적용하여 통계적으로 의존적인 에이전트 궤적의 분포를 학습합니다. 우리는 baller2vec(baller2vec++의 전신)와 달리, baller2vec++가 시뮬레이션된 간단한 데이터셋에서 완벽하게 협력하는 에이전트들의 행동을 모방할 수 있음을 보여줍니다. 또한 프로 농구 선수들의 궤적을 모델링할 때, baller2vec++는 baller2vec보다 크게 우월한 성능을 보임을 확인하였습니다.