Speechmatics医疗语音转写准确率突破93%创行业新纪录
10 天前
英国剑桥讯——语音识别公司Speechmatics今日发布新一代医疗语音转写(Speech-to-Text, STT)模型,实现93%的临床真实场景准确率,创下医疗语音识别新纪录。该模型在关键临床术语识别上错误率降低50%,整体词错误率较行业第二名降低17%,显著优于现有系统。 新模型专为复杂多变的临床环境设计,具备无口音依赖的语音识别能力,可精准处理不同语速、快速交替发言及复杂语境下的对话。其实时说话人分离技术能准确区分医生、患者及家属,即使在背景噪音或打断情况下也能确保发言归属清晰。 模型覆盖范围大幅扩展,包含大量药物名称、剂量、医疗操作术语,并支持数字与时间格式的结构化输出,有效减少人工校对,提升病历交接的清晰度与准确性。支持批量与实时双模式运行,适用于AI病历助手和语音录入工作流,助力医疗领域实现大规模“环境化文档记录”转型。 Speechmatics首席执行官凯蒂·维格达尔表示:“我们的目标很简单——打造医生真正信赖的语音技术,让每一种声音都被准确理解。当技术真正懂你,医疗体验才能回归人性化。每一个准确的词,都为患者节省时间,为医生减轻负担。” 在最新基准测试中,Speechmatics的关键词错误率(KER)仅4%,远超同行(74%-91%),领先第二名达2个百分点。其模型从设计之初即以实时处理为核心,实现从文件转写到实时识别的无缝切换,无需牺牲精度。 Speechmatics提供企业级语音识别技术,支持55种以上语言,适应多种口音与重叠对话,可灵活部署于云、本地或边缘环境。其技术已广泛应用于医疗、媒体、客服中心、语音助手及AI工作流等领域,合作伙伴遍及全球领先科技企业。公司总部位于剑桥与伦敦。