
초록
자동 언어 식별은 도전적인 문제이다. 특히 유사한 언어들 간의 구분은 더욱 어려운 과제이다. 본 논문은 기존 최첨단 도구가 자주 오분류를 겪는 노르딕 언어에 대한 자동 언어 식별을 위한 머신러닝 기반 접근법을 제시한다. 구체적으로 덴마크어, 스웨덴어, 노르웨이어(니노르스크), 노르웨이어(보크몰), 파로어, 아이슬란드어 등 6개의 노르딕 언어 간의 구분에 초점을 맞춘다.
자동 언어 식별은 도전적인 문제이다. 특히 유사한 언어들 간의 구분은 더욱 어려운 과제이다. 본 논문은 기존 최첨단 도구가 자주 오분류를 겪는 노르딕 언어에 대한 자동 언어 식별을 위한 머신러닝 기반 접근법을 제시한다. 구체적으로 덴마크어, 스웨덴어, 노르웨이어(니노르스크), 노르웨이어(보크몰), 파로어, 아이슬란드어 등 6개의 노르딕 언어 간의 구분에 초점을 맞춘다.