HyperAIHyperAI

Command Palette

Search for a command to run...

AI诊断准确率超越医生20%!芝大团队揭秘AI辅助临床的潜力与关键瓶颈

芝加哥大学研究团队最新发现,尽管AI在前列腺癌磁共振成像(MRI)诊断中的准确率已超过人类专家,但人机协作并未自动带来更优结果,反而暴露出深层瓶颈。该研究由陈诧姹博士主导,聚焦于一个临床难度高、医生诊断准确率普遍不高的真实场景,旨在探索AI辅助诊断的真正潜力。 研究团队基于nnU-Net架构训练AI模型,使用1411例病例的PI-CAI公开数据集,其在测试集上的AUROC分别达到0.730和0.790,显著高于8名资深放射科医生的平均准确率(63.2%)。实验分两阶段进行:第一阶段,医生先独立诊断,再参考AI建议;第二阶段则在提供个人表现反馈和直接展示AI预测的前提下,进行新病例诊断。 结果显示,AI辅助虽使医生准确率提升至66.2%,但仍低于AI自身69.3%的水平。关键问题在于,医生在AI与自己判断不一致时,仅在20.4%的情况下选择采纳AI意见,尤其在自身判断准确率仅44.4%的分歧病例中,仍坚持己见。这表明,医生难以判断AI何时可靠,信任机制存在严重偏差。 更令人意外的是,当研究转向群体协作模式,通过“多数票决”整合8位医生在AI辅助下的诊断结果时,整体准确率跃升至73.3%,首次超越AI和人类各自的独立表现。这一结果证明,人类经验与AI能力具备互补潜力,但需通过团队协作机制才能实现。 研究指出,未来AI临床应用不应仅聚焦于提升单个医生对AI的依赖,而应构建“人机协作团队”。关键路径包括:持续优化AI模型,明确其能力边界,并通过可视化反馈帮助医生理解AI在哪些病例中更可靠。只有当医生具备对AI的理性认知,人机协作才能真正释放潜力,实现“1+1>2”的临床价值。相关成果已发表于ACM Conference on Fairness, Accountability, and Transparency。

相关链接