
摘要
内镜检查中准确测量息肉尺寸对于评估癌症风险至关重要,但目前受限于主观性较强的测量方法以及缺乏融合二维外观、三维结构和真实尺寸信息的高质量数据集。为此,我们提出 PolypSense3D——首个面向深度感知息肉尺寸测量的多源基准数据集。该数据集独特地整合了来自虚拟仿真、物理模型和临床视频序列的超过43,000帧图像,提供同步的RGB图像、稠密/稀疏深度图、分割掩码、相机参数以及通过一种新型钳夹辅助在体标注技术获得的毫米级尺寸标签。为验证其价值,我们对当前最先进的分割与深度估计模型进行了基准测试。结果量化了仿真/模型数据与临床数据之间显著的域差异,并揭示了从感知阶段到最终尺寸估计过程中存在明显的误差传播现象;即使在最佳的全自动处理流程中,对临床数据子集的平均绝对误差(MAE)仍达到0.95毫米。PolypSense3D 已依据 CC BY-SA 4.0 协议公开发布,配套提供代码与评估协议,为推动鲁棒、临床相关性高的定量内镜视觉研究提供了标准化平台。