HyperAIHyperAI

Command Palette

Search for a command to run...

NVIDIA Nemotron与智能体技能加速临床ASR评估

近日,英伟达发布基于AI智能体技能的临床语音识别自动评估工作流,旨在解决医疗专科术语识别难题。传统语音模型难以精准识别药物名称与手术术语,且真实临床音频面临采集成本高、标注周期长及严格隐私合规限制。该方案结合合成数据生成技术与NVIDIA NeMo Data Designer及Nemotron Speech服务,构建音素级控制的标准化数据管线。工作流依托智能体引导开发者完成临床画像设定、基准构建、发音审核、模型评估与迭代优化的完整飞轮。系统自动将目标术语转化为含SSML音素标记的语音文本,结合字典校验与人工复核机制修正发音偏差。评测模块实时监测关键实体错误率,智能诊断模型薄弱环节,若识别失败源于发音覆盖不足则自动路由至数据构建环节,避免无效微调。骨科场景验证表明,该方案有效规避隐私合规风险,支持合成数据的版本管理与自动化测试,显著提升专科词汇识别准确率,大幅缩短模型迭代周期,为医疗语音AI的规模化部署提供可重复的标准化路径。

相关链接