摘要
自动手语翻译(Automatic Sign Language Translation, SLT)系统在提升聋人群体内部及其与外界沟通效率方面具有重要价值。然而,当前实现高效翻译模型的主要障碍在于标注数据的严重匮乏,这限制了现代深度学习模型的应用与性能发挥。SLT是一个复杂的多任务问题,其中手形识别(handshape recognition)是最关键的子任务之一。本文针对小样本数据场景,对比了一系列专为小数据集优化的模型,以提升手形识别的性能。我们评估了Wide-DenseNet与少样本原型网络(Prototypical Network)在有无迁移学习(transfer learning)条件下的表现,并进一步引入模型无关元学习(Model-Agnostic Meta-Learning, MAML)方法进行对比分析。研究结果表明,未采用迁移学习的Wide-DenseNet以及采用迁移学习的原型网络在性能上表现最佳。其中,原型网络在样本数量少于30个时展现出显著优势;而Wide-DenseNet在样本量较大时则取得最优结果。相比之下,MAML在所有实验场景中均未带来性能提升。这些发现为构建更高效、适应性强的SLT系统提供了重要参考依据。