
초록
우리는 Long Short-Term Memory (LSTM) 유닛을 포함하는 Recurrent Neural Networks (RNNs)에 대한 간단한 정규화 기술을 제시합니다. 신경망의 정규화에서 가장 성공적인 기술인 드롭아웃(Dropout)은 RNNs와 LSTMs에서 잘 작동하지 않습니다. 본 논문에서는 LSTM에 드롭아웃을 올바르게 적용하는 방법을 설명하며, 이 방법이 다양한 작업에서 과적합을 크게 줄이는 것을 보여줍니다. 이러한 작업에는 언어 모델링, 음성 인식, 이미지 캡션 생성, 그리고 기계 번역이 포함됩니다.