17일 전

Slovo: 러시아 수어 데이터셋

Alexander Kapitanov, Karina Kvanchiani, Alexander Nagaev, Elizaveta Petrova
Slovo: 러시아 수어 데이터셋
초록

수신 장애인과 청각 능력이 정상인 사회 간의 격차로 인해, 수어 인식 작업의 주요 과제 중 하나는 적절한 데이터셋을 수집하는 데 어려움이 있다는 점이다. 또한 각국의 수어는 상당히 다르기 때문에, 각 국가별로 새로운 데이터를 개별적으로 생성해야 하는 상황에 놓여 있다. 본 논문에서는 커뮤니티 기반 플랫폼을 활용하여 제작한 러시아 수어(RSL) 영상 데이터셋 Slovo를 제안한다. 이 데이터셋은 194명의 수어 사용자가 수행한 고립된 RSL 제스처 1,000개 클래스에 대한 20,000개의 FullHD 영상 기록을 포함하고 있다. 또한 데이터 수집부터 영상 주석 처리까지 전 과정을 포함한 데이터셋 생성 파이프라인과 함께 실습용 애플리케이션도 제공한다. Slovo 데이터셋을 기반으로 여러 신경망 모델을 학습하고 평가하여 그 교육 가능성을 입증하였다. 제안된 데이터셋과 사전 학습된 모델은 모두 공개되어 있다.