17 天前
基于Transformer的野外透明物体分割
Enze Xie, Wenjia Wang, Wenhai Wang, Peize Sun, Hang Xu, Ding Liang, Ping Luo

摘要
本工作提出了一种新的细粒度透明物体分割数据集,命名为Trans10K-v2,该数据集在首个大规模透明物体分割数据集Trans10K-v1的基础上进行了扩展。与仅包含两个有限类别的Trans10K-v1不同,本数据集具备多项显著优势:(1)包含11个细粒度的透明物体类别,均为人类日常生活环境中常见的物体,因而更具现实应用价值;(2)相较于前代版本,Trans10K-v2为当前先进的分割方法带来了更大的挑战性。此外,本文提出了一种基于Transformer的新型分割框架,称为Trans2Seg。该框架具有以下两个核心特点:首先,Trans2Seg中的Transformer编码器具备全局感受野,相较于CNN的局部感受野,展现出显著优势;其次,通过将语义分割建模为字典查询问题,我们设计了一组可学习的原型作为Trans2Seg中Transformer解码器的查询向量,每个原型能够学习整个数据集中对应类别的统计特征。我们在超过20种近期的语义分割方法上进行了基准测试,结果表明,Trans2Seg显著优于所有基于CNN的方法,充分展现了所提出算法在解决透明物体分割问题上的巨大潜力。