医疗AI测试“静默试验”漏洞频现 研究揭示重大安全缺口
由阿德莱德大学研究人员主导的一项新研究发现,目前用于医疗人工智能(AI)工具早期测试的“沉默试验”(silent trials)缺乏统一规范,存在广泛差距。该研究发表于《自然·健康》杂志,是一项全球范围的范围性综述,聚焦于AI医疗工具在临床环境中应用前的早期测试阶段。 研究指出,尽管“沉默试验”被广泛用于在不干扰临床流程的前提下评估AI工具的性能,但各地实施方式差异极大,缺乏明确的指导原则。不同机构在试验设计、数据收集、评估标准以及对医生和患者影响的衡量方面采用的方法各不相同,导致结果难以比较,也影响了对AI工具真实效能的判断。 此外,研究还发现,多数试验未充分考虑AI系统在真实临床环境中的可靠性、公平性及潜在风险,也缺乏对医疗人员反馈的系统性记录。部分试验甚至未向临床团队明确说明AI工具的使用目的,可能引发伦理和责任问题。 研究人员呼吁,应建立全球统一的规范框架,明确沉默试验的实施标准、数据透明度要求以及对患者安全和临床决策影响的评估机制,以确保AI医疗工具在进入实际应用前得到科学、严谨和负责任的验证。
