2 个月前
深度学习在古典日语文学中的应用
Tarin Clanuwat; Mikel Bober-Irizar; Asanobu Kitamoto; Alex Lamb; Kazuaki Yamamoto; David Ha

摘要
机器学习研究的很大一部分集中在开发在基准任务上表现优异的模型,从而加深我们对这些任务所涉及挑战的理解。从机器学习研究人员的角度来看,任务的具体内容大多无关紧要,因此越来越多的人呼吁基准任务应更加关注具有社会或文化意义的问题。在这项工作中,我们引入了 Kuzushiji-MNIST 数据集,该数据集专注于草书日文(Kuzushiji),以及两个更大、更具挑战性的数据集 Kuzushiji-49 和 Kuzushiji-Kanji。通过这些数据集,我们希望吸引机器学习社区进入古典日文文学的世界。数据集可在 https://github.com/rois-codh/kmnist 获取。