17일 전
시그니처 언어 번역을 위한 토큰 수준의 대비 프레임워크
Biao Fu, Peigen Ye, Liang Zhang, Pei Yu, Cong Hu, Yidong Chen, Xiaodong Shi

초록
서면 언어 번역(SLT)은 청각 장애인과 청각 능력이 있는 사람 간의 소통 격차를 해소할 수 있는 유망한 기술로 주목받고 있다. 최근 연구자들은 일반적으로 대규모 코퍼스를 필요로 하는 신경 기계 번역(NMT) 기법을 활용하여 SLT를 실현하고 있다. 그러나 공개적으로 이용 가능한 SLT 코퍼스는 매우 제한적이며, 이로 인해 토큰 표현이 붕괴되고 생성된 토큰의 정확도가 저하되는 문제가 발생한다. 이러한 문제를 완화하기 위해, 우리는 토큰 수준의 \textbf{Con}트라스티브 학습 프레임워크인 \textbf{Con}SLT를 제안한다. 이는 SLT 디코딩 과정에 토큰 수준의 대조 학습을 통합함으로써 효과적인 토큰 표현을 학습한다. 구체적으로, ConSLT는 디코딩 중 각 토큰과 서로 다른 드롭아웃 마스크에 의해 생성된 대응 토큰을 긍정 쌍으로 간주하고, 현재 문장에 포함되지 않은 어휘 내에서 무작위로 $K$개의 토큰을 샘플링하여 부정 예시를 구성한다. 우리는 엔드투엔드 및 캐스케이드 설정 모두에서 두 가지 벤치마크(PHOENIX14T 및 CSL-Daily)를 대상으로 종합적인 실험을 수행하였다. 실험 결과, ConSLT가 강력한 기준 모델보다 더 우수한 번역 품질을 달성함을 확인하였다.