2 个月前

深度重音标注:高效的层次递归以改善阿拉伯语重音标注

Badr AlKhamissi; Muhammad N. ElNokrashy; Mohamed Gabr
深度重音标注:高效的层次递归以改善阿拉伯语重音标注
摘要

我们提出了一种新颖的架构,用于标记字符序列,在Tashkeela阿拉伯语短音符标注基准测试中取得了最先进的结果。该架构的核心是一个两层递归层次结构,分别在单词和字符级别上运行——这使得其训练和推理速度比类似的传统模型更快。一个跨层级注意力模块进一步连接了这两个层次,并为网络的可解释性打开了大门。任务模块是一个softmax分类器,用于枚举有效的短音符组合。该架构还可以通过一个递归解码器进行扩展,该解码器可以选择性地接受部分标注文本的先验信息,从而提高性能。我们还采用了诸如句子丢弃和多数投票等额外技巧,以进一步提升最终结果。我们的最佳模型实现了5.34%的词错误率(WER),相对于之前的最先进水平,相对错误率降低了30.56%。

深度重音标注:高效的层次递归以改善阿拉伯语重音标注 | 最新论文 | HyperAI超神经