2달 전
고전 일본 문학을 위한 딥 러닝
Tarin Clanuwat; Mikel Bober-Irizar; Asanobu Kitamoto; Alex Lamb; Kazuaki Yamamoto; David Ha

초록
기계 학습 연구의 대부분은 벤치마크 작업에서 우수한 성능을 내는 모델 개발에 초점을 맞추고 있으며, 이로 인해 해당 작업과 관련된 도전 과제에 대한 이해가 향상되고 있습니다. ML 연구자들의 관점에서 보면, 작업 자체의 내용은 크게 중요하지 않으므로 사회적 또는 문화적으로 중요한 문제에 더 많이 집중해야 한다는 주장이 점차 늘어나고 있습니다. 본 연구에서는 고서체 일본어(쿠주시지)를 중심으로 하는 데이터셋인 Kuzushiji-MNIST를 소개하며, 이를 확장하여 두 개의 더 크고 어려운 데이터셋인 Kuzushiji-49와 Kuzushiji-Kanji도 제시합니다. 이러한 데이터셋을 통해 우리는 기계 학습 커뮤니티가 고전 일본 문학 세계로 진입할 수 있도록 유도하고자 합니다. 데이터셋은 https://github.com/rois-codh/kmnist에서 이용 가능합니다.