7 天前

LVIS挑战赛技术报告 一等奖解决方案:面向大规模词汇实例分割的分布平衡与边界精修

WeiFu Fu, CongChong Nie, Ting Sun, Jun Liu, TianLiang Zhang, Yong Liu
LVIS挑战赛技术报告 一等奖解决方案:面向大规模词汇实例分割的分布平衡与边界精修
摘要

本报告介绍了团队 FuXi-Fresher 参加 LVIS Challenge 2021 的技术细节。我们的方法主要针对两个关键问题:长尾分布问题以及掩码(mask)与边界(boundary)的分割质量。在先进的 HTC 实例分割算法基础上,我们采用受 CBNetv2 启发的复合连接结构,将 Swin-L 变换器(Transformer)作为主干网络,以显著提升基线性能。为缓解长尾分布带来的挑战,我们设计了一种分布平衡方法(Distribution Balanced Method),该方法包含数据集平衡模块与损失函数平衡模块,有效缓解了类别样本不均衡问题。为进一步提升分割质量,我们提出了一种掩码与边界精炼方法(Mask and Boundary Refinement Method),该方法结合掩码评分(mask scoring)与精炼掩码(refine-mask)算法,显著改善了分割结果的精度与边界一致性。此外,我们意外发现,采用早停(early stopping)策略结合指数移动平均(EMA)方法,能够带来显著的性能提升。最后,通过引入多尺度测试(multi-scale testing)并放宽单张图像检测目标数量的上限,我们在 LVIS Challenge 2021 的验证集上取得了超过 45.4% 的边界 AP(Boundary AP)成绩。在测试集上,我们的方法排名首位,达到 48.1% 的 AP,其中 APr 达到 47.5%,与 APf(full dataset AP)的 48.0% 非常接近,展现出优异的泛化能力与分割性能。

LVIS挑战赛技术报告 一等奖解决方案:面向大规模词汇实例分割的分布平衡与边界精修 | 最新论文 | HyperAI超神经