17日前
Slovo:ロシア手話データセット
Alexander Kapitanov, Karina Kvanchiani, Alexander Nagaev, Elizaveta Petrova

要約
符号言語認識タスクにおける主な課題の一つは、難聴者社会と聴覚正常者社会との間に存在する隔たりにより、適切なデータセットを収集することが困難である点にある。さらに、各国における符号言語は著しく異なっているため、それぞれの国ごとに新たなデータセットの作成が不可欠となる。本論文では、クラウドソーシングプラットフォームを活用して作成されたロシア符号言語(RSL)の動画データセット「Slovo」を提示する。このデータセットは、194名の発話者によって収集された1,000種類の分離されたRSLジェスチャーを含む、FullHD解像度の動画計20,000件から構成されている。また、データ収集から動画アノテーションに至るまでのデータセット作成プロセス全体を公開し、デモアプリケーションも併せて提供している。Slovoデータセット上で複数のニューラルネットワークを訓練・評価することで、本データセットの教育的有用性を示している。提案されたデータセットおよび事前学習済みモデルは、すべて公開されている。