
摘要
除了生成数据和注释外,制定合理的数据分割策略和评估指标对于创建基准数据集也至关重要。这一做法确保了数据使用的共识、评估的一致性和研究方法在该数据集上的统一比较。本研究重点关注CholecT50,这是一个包含50个手术视频的数据集,将手术活动形式化为<器械, 动词, 目标>三元组。本文介绍了CholecT50和CholecT45数据集的标准分割方法,并展示了它们与现有数据集使用方法的对比。CholecT45是CholecT50数据集中首次公开发布的45个视频。我们还开发了一个名为ivtmetrics的评估指标库,用于对手术三元组模型进行评估。此外,我们通过在最常用深度学习框架(PyTorch和TensorFlow)中重现基线方法,进行了基准研究,并使用所提出的数据分割方法和评估指标对这些方法进行了评估,同时公开发布了这些基线方法以支持未来的研究。所提出的数据分割方法和评估指标将有助于在全球范围内跟踪该数据集的研究进展,并促进最优模型的选择以进一步部署。