2 个月前

无监督领域适应在手术室中的临床医生姿态估计和实例分割

Vinkle Srivastav; Afshin Gangi; Nicolas Padoy
无监督领域适应在手术室中的临床医生姿态估计和实例分割
摘要

在手术室(OR)中对临床医生进行细粒度定位是设计新一代手术室支持系统的关键组成部分。为了更好地理解临床活动和手术室的空间布局,需要计算机视觉模型来进行基于像素的人体分割和身体关键点检测。这是一项具有挑战性的任务,不仅因为手术室图像与传统视觉数据集非常不同,还因为隐私问题使得在手术室内收集和生成数据及注释变得困难。为了解决这些问题,我们首先研究了如何在低分辨率图像上执行联合人体姿态估计和实例分割,下采样因子从1倍到12倍不等。其次,为了解决域迁移和缺乏注释的问题,我们提出了一种新的无监督域适应方法——AdaptOR,该方法可以将一个在野外标记的源域模型适应到统计上不同的未标记目标域。我们建议利用未标记目标域图像的不同增强方式中的显式几何约束来生成准确的伪标签,并使用这些伪标签在一个自训练框架中对手术室的高分辨率和低分辨率图像进行模型训练。此外,我们提出了分离特征归一化方法来处理统计上不同的源域和目标域数据。我们在两个手术室数据集MVOR+和TUM-OR-test上的大量实验结果及其详细的消融研究表明,我们的方法在强基线模型对比中表现出色,尤其是在低分辨率保护隐私的手术室图像上。最后,我们在大规模COCO数据集上展示了我们方法作为半监督学习(SSL)方法的通用性,在仅使用1%的标记监督的情况下取得了与使用100%标记监督训练的模型相当的结果。

无监督领域适应在手术室中的临床医生姿态估计和实例分割 | 最新论文 | HyperAI超神经