2 个月前

使用BERT进行捷克语的重音符号恢复及其分析

Jakub Náplava; Milan Straka; Jana Straková
使用BERT进行捷克语的重音符号恢复及其分析
摘要

我们提出了一种基于上下文嵌入的新架构用于恢复重音符号,特别是使用了BERT模型,并在12种带有重音符号的语言上对其进行了评估。此外,我们对捷克语进行了详细的错误分析,捷克语是一种形态丰富的语言,具有较高的重音符号使用频率。值得注意的是,我们手动标注了所有误预测结果,结果显示大约44%的误预测实际上并不是错误,而是合理的变体(19%)或系统对错误数据的修正(25%)。最后,我们详细分类了真正的错误。我们在https://github.com/ufal/bert-diacritics-restoration发布了代码。

使用BERT进行捷克语的重音符号恢复及其分析 | 最新论文 | HyperAI超神经