
要約
自動言語識別は困難な問題である。特に類似度の高い言語を区別することは極めて難しい。本稿では、既存の最先端ツールがしばしば誤分類を引き起こす北欧諸言語に対する自動言語識別に向けた機械学習アプローチを提示する。具体的には、デンマーク語、スウェーデン語、ノルウェー語(ニーノシュ)、ノルウェー語(ボクマール)、ファローエ語、アイスランド語の6言語間の識別に注目する。
自動言語識別は困難な問題である。特に類似度の高い言語を区別することは極めて難しい。本稿では、既存の最先端ツールがしばしば誤分類を引き起こす北欧諸言語に対する自動言語識別に向けた機械学習アプローチを提示する。具体的には、デンマーク語、スウェーデン語、ノルウェー語(ニーノシュ)、ノルウェー語(ボクマール)、ファローエ語、アイスランド語の6言語間の識別に注目する。