中国未来医生团队发布医疗AI安全有效新标准
纽约——(商业wire)——总部位于中国的AI医疗科技公司Future Doctor联合32位临床专家,在自然科研旗下《npj数字医学》发表最新研究,提出“临床安全-有效性双轨评估基准”(CSEDB)。该框架旨在衡量医疗AI系统在真实临床决策中的安全性与有效性,填补了当前AI医疗评估体系中对实际应用效果与风险控制缺乏统一标准的空白。 研究对当前主流大语言模型进行了对比评估,包括OpenAI的o3和Google的Gemini 2.5 Pro等。评估结果显示,尽管这些模型在知识广度和语言生成方面表现优异,但在临床推理的准确性、风险识别能力以及对复杂病例的处理上仍存在显著不足,尤其在涉及罕见病、多病共存或治疗方案冲突等高风险场景时,错误率明显上升。 CSEDB框架从两个核心维度构建评估体系:一是“安全性”,评估AI是否可能输出误导性、危险或不符合医学指南的建议;二是“有效性”,衡量其在真实临床场景中能否提供准确、可操作且符合循证医学的决策支持。该框架还引入了多轮专家评审、真实病例测试与动态监控机制,以确保评估结果贴近临床实践。 研究团队强调,当前多数AI医疗系统仍处于“实验室验证”阶段,缺乏在真实医院环境中的长期表现数据。CSEDB的提出,旨在推动AI医疗从“技术性能导向”转向“临床价值导向”,为监管机构、医疗机构和开发者提供可量化、可复现的评估工具。 未来,该框架有望被纳入国家医疗AI产品准入标准,并推动建立AI辅助诊疗的“安全使用白名单”。研究人员表示,只有在确保安全的前提下实现临床价值,AI才能真正成为医生的“智能协作者”,而非替代者。
