Back to Headlines

Speechmatics Achieves 93% Accuracy in Medical Speech-to-Text, Setting New Industry Standard

10일 전

영국 캠브리지 기반의 스피치 기술 기업 스피치매틱스(Speechmatics)가 의료 분야에서 새로운 기록을 세웠다. 최근 발표한 의료용 음성-텍스트 변환(Speech-to-Text, STT) 모델은 실제 임상 현장에서 93%의 정확도를 기록하며, 기존 최고 수준보다 50% 적은 진단·처방 등 핵심 의료 용어 오류와 17% 낮은 전반적인 단어 오류를 달성했다. 이 모델은 다양한 억양에 관계없이 음성을 정확히 인식하고, 다인용 대화에서 의사, 환자, 가족의 발화를 실시간으로 구분하는 스피커 다이어리제이션 기능을 탑재했다. 특히 약물명, 용량, 수술명 등 폭넓은 의료 용어를 포함하며, 숫자와 시간 정보도 구조화된 형식으로 처리해 진료 기록의 명확성과 전달력을 높였다. 실제 임상 환경의 복잡성과 빠른 톤 전환에도 안정적인 성능을 보이며, 파일 기반과 실시간 처리 모두에서 높은 정확도를 유지한다. 특히 키워드 오류율(KER)이 4%로, 의료 정보의 정확한 기록에 핵심적인 의미를 지닌다. 이는 기존 최고 수준인 91%를 웃도는 성과다. 스피치매틱스의 케이티 와이드할 CEO는 “의료 현장의 혼란 속에서도 신뢰할 수 있는 음성 기술을 만들고 싶다. 정확한 한 글자도 환자와 의료진의 시간을 되찾아준다”며, 기술이 의료진의 번아웃 완화와 환자 중심 진료에 기여할 수 있음을 강조했다. 이 모델은 AI-스카이브 및 음성 입력 기반 진료 기록 시스템에 즉시 통합 가능하며, 클라우드, 온프레미스, 엣지 환경에서 유연하게 운영된다. 현재 55개 이상의 언어를 지원하며, 글로벌 의료 기관의 앰비언트 문서화(자동 기록) 전환을 가속화하고 있다.

Related Links