17日前
LSA-T:手話翻訳向けの最初の連続的アルゼンチン手話データセット
Pedro Dal Bianco, Gastón Ríos, Franco Ronchetti, Facundo Quiroga, Oscar Stanchi, Waldo Hasperué, Alejandro Rosete

要約
手話翻訳(SLT)は、人間とコンピュータの相互作用、コンピュータビジョン、自然言語処理、機械学習を含む活発な研究分野である。この分野における進展は、聴覚障害者の社会的統合をより高次元で実現する可能性を秘めている。本論文では、筆者らの知る限り、初めての連続的アルゼンチン手話(LSA)データセットを提示する。このデータセットは、CN SordosのYouTubeチャンネルから抽出された14,880件の文単位のLSA動画を収録しており、各サインラーについてラベルとキーポイントアノテーションが付与されている。さらに、本研究では、活動中のサインラーを推定する手法、データセットの特性に関する詳細な分析、データセットを探索可能な可視化ツール、および今後の実験のベースラインとして用いるためのニューラル手話翻訳モデルも提案している。