17일 전
LSA-T: 서인도 제도 수화 번역을 위한 첫 번째 지속적인 아르헨티나 수화 데이터셋
Pedro Dal Bianco, Gastón Ríos, Franco Ronchetti, Facundo Quiroga, Oscar Stanchi, Waldo Hasperué, Alejandro Rosete

초록
수신어 번역(SLT, Sign Language Translation)은 인간-컴퓨터 상호작용, 컴퓨터 비전, 자연어 처리 및 머신러닝을 포함하는 활발한 연구 분야이다. 이 분야의 발전은 청각장애인의 사회적 통합 수준을 더욱 높일 수 있다. 본 논문은 지식의 범위 내에서 처음으로 지속적인 아르헨티나 수신어(LSA, Lengua de Señas Argentina) 데이터셋을 제안한다. 이 데이터셋은 CN Sordos 유튜브 채널에서 추출한 총 14,880개의 문장 수준 영상으로 구성되며, 각 서커(signer)에 대해 레이블과 키포인트(annotation) 정보가 제공된다. 또한 본 연구에서는 활성 서커(Active Signer)를 추론하는 방법, 데이터셋의 특성에 대한 체계적인 분석, 데이터셋 탐색을 위한 시각화 도구, 그리고 향후 실험을 위한 기준 모델로서 활용 가능한 신경망 기반 SLT 모델을 제시한다.