HyperAI超神经

纽约——（商业wire）——总部位于中国的AI医疗科技公司Future Doctor联合32位临床专家，在自然科研旗下《npj数字医学》发表最新研究，提出“临床安全-有效性双轨评估基准”（CSEDB）。该框架旨在衡量医疗AI系统在真实临床决策中的安全性与有效性，填补了当前AI医疗评估体系中对实际应用效果与风险控制缺乏统一标准的空白。研究对当前主流大语言模型进行了对比评估，包括OpenAI的o3和Google的Gemini 2.5 Pro等。评估结果显示，尽管这些模型在知识广度和语言生成方面表现优异，但在临床推理的准确性、风险识别能力以及对复杂病例的处理上仍存在显著不足，尤其在涉及罕见病、多病共存或治疗方案冲突等高风险场景时，错误率明显上升。 CSEDB框架从两个核心维度构建评估体系：一是“安全性”，评估AI是否可能输出误导性、危险或不符合医学指南的建议；二是“有效性”，衡量其在真实临床场景中能否提供准确、可操作且符合循证医学的决策支持。该框架还引入了多轮专家评审、真实病例测试与动态监控机制，以确保评估结果贴近临床实践。研究团队强调，当前多数AI医疗系统仍处于“实验室验证”阶段，缺乏在真实医院环境中的长期表现数据。CSEDB的提出，旨在推动AI医疗从“技术性能导向”转向“临床价值导向”，为监管机构、医疗机构和开发者提供可量化、可复现的评估工具。未来，该框架有望被纳入国家医疗AI产品准入标准，并推动建立AI辅助诊疗的“安全使用白名单”。研究人员表示，只有在确保安全的前提下实现临床价值，AI才能真正成为医生的“智能协作者”，而非替代者。

相关链接

相关链接

相关链接

在线教程丨基于 500 万小时语音数据，Qwen3-TTS 实现 3 秒语音克隆及精细调控

在线教程丨基于 500 万小时语音数据，Qwen3-TTS 实现 3 秒语音克隆及精细调控

Command Palette

中国未来医生团队发布医疗AI安全有效新标准

相关链接

Command Palette

中国未来医生团队发布医疗AI安全有效新标准

相关链接

Command Palette

中国未来医生团队发布医疗AI安全有效新标准

相关链接

在线教程丨基于 500 万小时语音数据，Qwen3-TTS 实现 3 秒语音克隆及精细调控

在线教程丨基于 500 万小时语音数据，Qwen3-TTS 实现 3 秒语音克隆及精细调控