AI医療機器の「サイレント試験」にガイドラインの欠如——南アデレード大が全球レビューで指摘
アデレード大学の研究チームが主導したレビューで、医療分野におけるAIツールの初期評価段階である「サイレント試験」の実施に、明確なガイドラインが欠如していることが明らかになった。このレビューは、Nature Healthに掲載され、世界中の医療機関でのサイレント試験の実施状況を調査したもの。その結果、試験の設計や効果評価の方法に大きなばらつきが見られ、標準化されたプロトコルが存在しないことが判明した。 サイレント試験とは、AIツールを臨床現場に導入しつつ、医師やスタッフがその出力を「監視」する形で実際の診療プロセスに組み込む試験手法。本質的に、AIの判断が医療現場に影響を与えるが、その結果が即座に介入や記録されないため「静かに」実施される。しかし、レビューでは、この試験の実施方法や、AIの正確性や有用性を測る指標が、病院や地域によって大きく異なっていることが明らかになった。 研究チームは、こうした不整合が、AIツールの安全性や信頼性の評価を困難にし、将来的な規制や臨床導入に支障をきたす可能性を懸念している。特に、評価基準の不透明さは、AIの誤診リスクや医療現場への負荷の増大を隠蔽するリスクを孕んでいる。 研究の主筆者であるアデレード大学の研究者らは、「サイレント試験はAIの実用化に不可欠な段階だが、その質を確保するためには国際的なガイドラインの策定が急務だ」と強調。今後、研究者、医療機関、規制当局が連携して、透明性と再現性を確保するための標準プロトコルの構築が求められている。
