8일 전

손모양 인식을 위한 소표본 방법 비교

{Laura Lanzarini, Waldo Hasperué, Pedro Dal Bianco, Gastón Gustavo Ríos, Ulises Jeremias Cornejo Fandos, Franco Ronchetti, Facundo Quiroga}
초록

자동 수어 번역(SLT) 시스템은 청각장애인 공동체 내외의 소통을 향상시키는 데 큰 도움이 될 수 있다. 현재 효과적인 번역 모델의 개발을 방해하는 주요 문제는 레이블링된 데이터의 부족이며, 이는 현대의 딥러닝 모델을 활용하는 데 큰 제약을 초래한다.SLT는 수많은 하위 작업을 포함하는 복잡한 문제로, 그 중 손모양 인식이 가장 중요한 과제이다. 우리는 소규모 데이터셋에 특화된 일련의 모델을 비교하여 손모양 인식 성능을 향상시키는 방안을 탐구한다. 특히, 전이학습(transfer learning)을 사용하거나 미사용한 Wide-DenseNet 및 소수 샘플 기반 프로토타입 네트워크(Prototypical Network) 모델을 평가하였으며, 모델에 독립적인 메타학습(Model-Agnostic Meta-Learning, MAML) 기법도 적용해보았다.연구 결과, 전이학습을 적용하지 않은 Wide-DenseNet과 전이학습을 적용한 프로토타입 네트워크가 가장 우수한 성능을 보였다. 특히 프로토타입 네트워크는 30개 미만의 샘플을 사용할 경우 매우 뛰어난 성능을 발휘하였으며, 샘플 수가 많을수록 Wide-DenseNet이 최고의 성능을 기록하였다. 반면 MAML 기법은 어떠한 시나리오에서도 성능 향상에 기여하지 못했다. 이러한 결과는 더 나은 SLT 모델 설계에 유용한 통찰을 제공할 수 있다.

손모양 인식을 위한 소표본 방법 비교 | 최신 연구 논문 | HyperAI초신경