
초록
초기 문명의 시작부터 각 개인으로부터 파생된 사회적 관계는 우리의 일상생활에서 사회 구조의 기반을 형성해 왔습니다. 컴퓨터 비전 분야에서는 객체 검출과 장면 해석 등의 장면 이해에 많은 진전이 이루어졌습니다. 최근 연구는 객체 간의 기능적 및 기하학적 관계에 초점을 맞추고 있습니다. 본 연구에서는 정지 이미지에서의 사회적 관계 인식 문제를 연구하고자 합니다. 우리는 사회적 관계 인식을 위한 이중 시선 모델을 제안하였으며, 첫 번째 시선은 관심 있는 개인 쌍에 집중하고 두 번째 시선은 주변 정보를 탐색하기 위해 주의 메커니즘을 활용합니다. 또한, 9가지 유형의 사회적 관계로 구성된 22,670장의 이미지와 76,568개의 주석 샘플을 포함하는 새로운 대규모 'People in Social Context (PISC)' 데이터셋을 수집하였습니다. 우리는 PISC 데이터셋에서 벤치마크 결과를 제공하며, 제안된 모델의 효과성을 질적으로 입증하였습니다.