突破性AI工具仅用少量数据就能精准解读医学影像
5 天前
一种新型人工智能工具GenSeg可显著减少医学影像分析模型训练所需的数据量,有望让医生和研究人员在数据稀缺的情况下也能高效开发精准的医疗AI系统。该工具由加州大学圣地亚哥分校(UC San Diego)电气与计算机工程系的博士生李卓(Li Zhang)领衔,与教授谢鹏涛(Pengtao Xie)团队共同研发,相关成果发表于《自然·通讯》。 医学图像分割是AI辅助诊断的关键步骤,需对图像中每个像素进行标注,如区分癌变组织与正常组织。传统深度学习方法依赖大量人工标注的图像数据,但获取这些数据成本高昂、耗时费力,尤其在罕见病或特殊临床场景中几乎不可行。GenSeg突破了这一瓶颈,仅需少量专家标注样本(最多减少20倍数据需求),即可实现高效训练。 该工具在多种医学影像任务中表现优异,包括皮肤病变识别、乳腺超声中的癌症检测、胎儿内窥镜图像中的胎盘血管分析、结肠镜图像中的息肉识别,以及普通相机拍摄的足部溃疡检测。它还成功应用于3D影像,如大脑海马体和肝脏的结构建模。在数据极度有限的条件下,其模型性能比现有方法提升10%至20%,且训练数据量仅为传统方法的1/8到1/20。 GenSeg采用端到端的数据生成框架,分两步运行:首先学习从分割掩码生成合成图像,再利用这些人工图像对真实数据集进行扩充。通过一个持续的反馈循环,系统根据模型学习效果不断优化生成图像的质量,确保合成数据不仅逼真,更精准服务于提升分割能力。 “我们首次将数据生成与模型训练融为一体,让分割表现直接指导数据生成,”李卓表示。这种协同机制使生成数据更具临床实用性。 未来,团队计划进一步提升工具的智能水平,并引入临床医生的反馈,使生成数据更贴近真实医疗场景,推动AI在基层医院和资源有限地区更快落地应用。