Back to Headlines

医療用音声認識モデルで93%の精度達成、臨床用語の誤りを50%削減

10日前

英国ケンブリッジを拠点とするSpeechmaticsは、医療分野向けの音声認識技術で新たな記録を達成した。同社が発表した次世代医療用音声認識モデルは、実世界の臨床現場で93%の高精度を実現し、業界トップクラスの性能を発揮した。特に、医療用語のキーワード誤りは競合他社比50%減少、全単語誤り率も17%低く抑えられた。この成果は、臨床現場の複雑さと多様性に適応するための技術的進化を示している。 新モデルは、多様なアクセントに対応する「アクセント独立型」設計を採用。複数の発話者が交差して会話する状況でも、医師、患者、家族など発話者を正確に識別するリアルタイムの話者分離(speaker diarization)機能を備える。さらに、薬剤名、投与量、治療手順など広範な医療用語を網羅し、数値や日時などの構造化出力をサポート。これにより、医師の手作業による修正作業が大幅に削減され、カルテ記録の明確さと連携の質が向上する。 キーワード誤り率(KER)はわずか4%にまで低下。これは、診断名や投薬量、治療スケジュールといった重要な情報が正確に記録されることを意味し、臨床判断の信頼性を高める。ベンチマークテストでは、競合他社の最高精度が91%にとどまる中、Speechmaticsは93%を達成。55以上の言語に対応し、クラウド・オンプレミス・エッジ環境での柔軟な展開も可能で、リアルタイム処理とファイルベース処理の両方で一貫した高精度を実現。 CEOのカティ・ウィグダール氏は「臨床現場の混沌とした実態に寄り添った音声技術を構築したい。正確な1語が、患者との時間を取り戻し、医師の燃え尽き防止につながる」と強調。医療現場における「アマビエントドキュメンテーション」(環境音ベースの自動記録)の普及を加速する重要な一歩として、このモデルの登場は注目される。

Related Links