17 天前

ESFPNet:用于自体荧光支气管镜视频实时病灶分割的高效深度学习架构

Qi Chang, Danish Ahmad, Jennifer Toth, Rebecca Bascom, William E. Higgins
ESFPNet:用于自体荧光支气管镜视频实时病灶分割的高效深度学习架构
摘要

肺癌往往在晚期才被发现,导致患者死亡率较高。因此,近年来大量研究致力于早期疾病检测。支气管镜检查是目前检测肺癌早期表现(如支气管病变)的一种有效且非侵入性方法。其中,自体荧光支气管镜检查(Autofluorescence Bronchoscopy, AFB)能够通过颜色差异区分正常组织(绿色)与病变组织(红褐色),从而实现对异常区域的可视化识别。由于近期研究表明AFB在检测病灶方面具有高灵敏度,该技术已成为支气管镜气道检查中极具潜力的关键手段。然而,人工逐帧审阅AFB视频耗时费力且易出错,而针对更稳健的自动化AFB病灶分析的研究仍十分有限。为此,本文提出一种实时深度学习架构——ESFPNet,用于在AFB视频流中实现高精度的支气管病变分割与鲁棒性检测,其处理吞吐量可达每秒27帧。该架构采用基于预训练Mix Transformer(MiT)编码器的编码器结构,并结合一种高效的分阶段特征金字塔(Efficient Stage-wise Feature Pyramid, ESFP)解码器结构。基于20名肺癌患者AFB气道检查视频的分割结果表明,本方法取得了平均Dice系数为0.756、平均交并比(IoU)为0.624的性能,显著优于其他现有先进架构。因此,ESFPNet为临床医生在实时支气管镜检查过程中提供了一种可靠、可信的病灶分割与检测工具。此外,本模型在其他医学图像分析领域也展现出良好的泛化能力:在CVC-ClinicDB、ETIS-LaribPolypDB数据集上达到当前最优(SOTA)表现,并在Kvasir、CVC-ColonDB数据集中表现出更优性能,显示出其在结肠镜、内镜等多模态医学图像分析任务中的广泛适用前景。