HyperAIHyperAI

Command Palette

Search for a command to run...

Scribosermo:面向德语及其他语言的快速语音转文本模型

Daniel Bermuth Alexander Poeppel Wolfgang Reif

摘要

近年来,语音识别模型通常需要大量硬件资源,且主要在英语语料上进行训练。本文提出了一种适用于德语、西班牙语和法语的语音识别模型,具备以下独特特性:(a)模型体积小巧,可在树莓派等微控制器上实现实时运行;(b)借助预训练的英语模型,仅需消费级硬件和相对较小的训练数据集即可完成训练;(c)在性能上可与现有解决方案相媲美,尤其在德语识别任务中表现更优。相较而言,现有方法仅具备本文所提出特性的部分组合,而本模型则综合了多项优势。此外,本文还发布了一个新的数据集处理库,该库设计注重可扩展性,便于轻松集成新的数据集,并提出了一种优化的跨语言迁移学习方法:利用具有相似字母系统的另一语言的预训练模型,高效迁移至新语言。


用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码
开箱即用的 GPU
最优定价

HyperAI Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供